ตอนที่ 4/7: ขั้นตอนการจัดทำและนำเข้าข้อมูล (Data Ingestion)

Spread the love
5/5 - (1 vote)

ในการเปลี่ยนผ่านสู่ Digital Navy ข้อมูลเปรียบเสมือนน้ำมันดิบครับ หากเราไม่นำมาผ่านกระบวนการคัดแยกและปรับปรุงคุณภาพ ก็ยากที่จะนำไปใช้งานต่อได้ บทความตอนนี้ AdminTee จะพาทุกท่านไปดู Workflow หรือกระบวนการตั้งแต่การเตรียม “ข้อมูลดิบ” ไปจนถึงการนำขึ้นระบบ CKAN อย่างถูกวิธี เพื่อให้ข้อมูลเหล่านั้นพร้อมใช้งานและค้นหาได้ง่ายตามมาตรฐานสากลครับ


เนื้อหาหลัก

1. จุดประสงค์

  • เพื่อให้เจ้าหน้าที่ทราบขั้นตอนการเปลี่ยนข้อมูลจากรูปแบบเอกสาร (Analog/Static) เป็นข้อมูลดิจิทัล (Digital/Machine-Readable)
  • เพื่อสร้างความเข้าใจในการเขียนคำอธิบายข้อมูล (Metadata) ตามมาตรฐานของสำนักงานพัฒนารัฐบาลดิจิทัล (DGA)
  • เพื่อให้ชุดข้อมูลที่นำขึ้นระบบมีคุณภาพ ถูกต้อง และพร้อมสำหรับการนำไปวิเคราะห์ต่อ

2. ความต้องการ

  • ชุดข้อมูลดิบที่ผ่านการตรวจสอบความถูกต้องและอนุมัติให้เผยแพร่ได้
  • ไฟล์ข้อมูลที่อยู่ในรูปแบบ “Machine-Readable” (เครื่องคอมพิวเตอร์สามารถอ่านและประมวลผลได้ทันที)
  • รายละเอียดคำอธิบายชุดข้อมูล (Metadata) ที่ครบถ้วนตามแบบฟอร์มมาตรฐาน

3. ลงรายละเอียดขั้นตอนการจัดทำ

  • การเตรียมไฟล์ (Data Preparation): หลีกเลี่ยงการใช้ไฟล์ภาพหรือ PDF ที่เป็นสแกนเอกสาร แต่ควรใช้ไฟล์รูปแบบ CSV (สำหรับตาราง), JSON (สำหรับนักพัฒนา) หรือเชื่อมต่อผ่าน API เพื่อความสะดวกในการดึงข้อมูลอัตโนมัติ
  • การจัดทำ Metadata: คือการเขียน “ข้อมูลอธิบายข้อมูล” เช่น ชื่อชุดข้อมูลคืออะไร, ใครเป็นเจ้าของ, อัปเดตครั้งล่าสุดเมื่อไหร่ และมีเงื่อนไขการนำไปใช้ประโยชน์อย่างไร (License)
  • การนำเข้าสู่ระบบ (Ingestion): เจ้าหน้าที่ทำการสร้างชุดข้อมูล (Dataset) ใน CKAN แล้วทำการอัปโหลดไฟล์ (Resource) พร้อมกรอกรายละเอียดที่เตรียมไว้ให้ครบถ้วน

4. ยกตัวอย่างการดำเนินการ

  • ข้อมูลราคากลางพัสดุ: แทนที่จะอัปโหลดไฟล์ PDF ที่สแกนจากกระดาษ เจ้าหน้าที่สารบรรณจัดทำข้อมูลลงในโปรแกรม Excel แล้วบันทึกเป็นไฟล์ .CSV จากนั้นนำขึ้นระบบ CKAN พร้อมระบุคำสำคัญ (Tag) เช่น “จัดซื้อจัดจ้าง”, “งบประมาณ”, “นขต.ทร.” เพื่อให้ง่ายต่อการสืบค้น
  • ข้อมูลพยากรณ์อากาศ: เจ้าหน้าที่เทคนิคตั้งค่าให้ระบบตรวจวัดอากาศส่งข้อมูลตรงเข้าสู่ CKAN ผ่านช่องทาง API ทำให้ข้อมูลบนหน้าเว็บเป็นปัจจุบันตลอดเวลา (Real-time)

สรุปเนื้อหา

ขั้นตอนการนำเข้าข้อมูล (Data Ingestion) ไม่ใช่แค่การอัปโหลดไฟล์ทิ้งไว้ แต่คือการตั้งใจเตรียมข้อมูลให้ “พร้อมใช้” โดยเน้นไฟล์รูปแบบ Machine-Readable และการเขียน Metadata ที่ชัดเจนตามมาตรฐาน DGA ซึ่งจะช่วยให้ข้อมูลของกองทัพเรือมีคุณค่าและถูกนำไปใช้ประโยชน์ได้อย่างสูงสุดครับ


ติดตามในตอนต่อไป

ในตอนที่ 5 AdminTee จะพาไปดูภาพใหญ่ขึ้น คือการเชื่อมโยงเครือข่ายข้อมูลระหว่าง “หน่วยขึ้นตรงกองทัพเรือ (นขต.ทร.)” ว่า CKAN จะช่วยทำลายกำแพงการกักเก็บข้อมูล (Data Silo) ของแต่ละหน่วยงานได้อย่างไร ติดตามนะครับ!


ลิงก์เอกสารอ้างอิง

ลิงก์เว็บไซต์ที่เกี่ยวข้อง


คำถามเพื่อการมีส่วนร่วม

  • ท่านพบปัญหาใดบ่อยที่สุดในการเตรียมไฟล์ข้อมูลจากเอกสารกระดาษให้เป็นไฟล์ Excel?
  • ท่านคิดว่า “คำสำคัญ” (Tag) ใดที่จะช่วยให้คนสืบค้นข้อมูลของหน่วยงานท่านได้รวดเร็วที่สุด?
  • ในหน่วยงานของท่าน มีข้อมูลใดบ้างที่เหมาะกับการเชื่อมต่อแบบ API (ข้อมูลที่เปลี่ยนแปลงบ่อย) หรือไม่?

Facebook Comments Box
Visited 31 times, 1 visit(s) today

Leave a Comment