คือการจัดทำระบบสารสนเทศที่รวบรวมคำอธิบายข้อมูล (Metadata) เพื่อให้ผู้ใช้งาน ไม่ว่าจะเป็น Data Scientist, AI Engineer หรือผู้บริหาร สามารถสืบค้นและทำความเข้าใจบริบทของข้อมูลได้โดยง่าย
ความสำคัญ: เปรียบเสมือน “ห้องสมุด” ที่ช่วยลดเวลาในการค้นหาข้อมูล (Data Discovery Time) ทำให้ทีมพัฒนาระบบ AI สามารถเข้าถึงชุดข้อมูลที่ต้องการได้อย่างรวดเร็วและแม่นยำ
ในทางปฏิบัติ ข้อมูลชุดเดียวกันมักถูกจัดเก็บกระจัดกระจายและอาจมีเนื้อหาไม่ตรงกัน การทำ Data Governance จำเป็นต้องกำหนดว่าแหล่งข้อมูลใดคือ “Golden Record” หรือ “Single Source of Truth”
ความสำคัญ: เพื่อป้องกันมิให้ AI เรียนรู้จากข้อมูลที่ล้าสมัยหรือข้อมูลสำรองที่ยังไม่ได้รับการอนุมัติ ซึ่งจะส่งผลโดยตรงต่อความถูกต้องของการประมวลผลและการตัดสินใจ
บทสรุป
การจัดทำ Data Discovery และ Data Catalog มิใช่เพียงภารกิจของฝ่ายเทคโนโลยีสารสนเทศ แต่เป็นรากฐานสำคัญที่ทุกหน่วยงานต้องร่วมมือกัน เพื่อเปลี่ยน “ข้อมูลดิบ” ให้กลายเป็น “สินทรัพย์ที่พร้อมใช้งาน” (AI-Ready Data) หากปราศจากรากฐานนี้ การลงทุนในเทคโนโลยี AI ระดับสูง อาจไม่สามารถตอบโจทย์พันธกิจขององค์กรได้อย่างแท้จริง