ในการเปลี่ยนผ่านสู่ Digital Navy ข้อมูลเปรียบเสมือนน้ำมันดิบครับ หากเราไม่นำมาผ่านกระบวนการคัดแยกและปรับปรุงคุณภาพ ก็ยากที่จะนำไปใช้งานต่อได้ บทความตอนนี้ AdminTee จะพาทุกท่านไปดู Workflow หรือกระบวนการตั้งแต่การเตรียม “ข้อมูลดิบ” ไปจนถึงการนำขึ้นระบบ CKAN อย่างถูกวิธี เพื่อให้ข้อมูลเหล่านั้นพร้อมใช้งานและค้นหาได้ง่ายตามมาตรฐานสากลครับ
เนื้อหาหลัก
1. จุดประสงค์
- เพื่อให้เจ้าหน้าที่ทราบขั้นตอนการเปลี่ยนข้อมูลจากรูปแบบเอกสาร (Analog/Static) เป็นข้อมูลดิจิทัล (Digital/Machine-Readable)
- เพื่อสร้างความเข้าใจในการเขียนคำอธิบายข้อมูล (Metadata) ตามมาตรฐานของสำนักงานพัฒนารัฐบาลดิจิทัล (DGA)
- เพื่อให้ชุดข้อมูลที่นำขึ้นระบบมีคุณภาพ ถูกต้อง และพร้อมสำหรับการนำไปวิเคราะห์ต่อ
2. ความต้องการ
- ชุดข้อมูลดิบที่ผ่านการตรวจสอบความถูกต้องและอนุมัติให้เผยแพร่ได้
- ไฟล์ข้อมูลที่อยู่ในรูปแบบ “Machine-Readable” (เครื่องคอมพิวเตอร์สามารถอ่านและประมวลผลได้ทันที)
- รายละเอียดคำอธิบายชุดข้อมูล (Metadata) ที่ครบถ้วนตามแบบฟอร์มมาตรฐาน
3. ลงรายละเอียดขั้นตอนการจัดทำ

- การเตรียมไฟล์ (Data Preparation): หลีกเลี่ยงการใช้ไฟล์ภาพหรือ PDF ที่เป็นสแกนเอกสาร แต่ควรใช้ไฟล์รูปแบบ CSV (สำหรับตาราง), JSON (สำหรับนักพัฒนา) หรือเชื่อมต่อผ่าน API เพื่อความสะดวกในการดึงข้อมูลอัตโนมัติ
- การจัดทำ Metadata: คือการเขียน “ข้อมูลอธิบายข้อมูล” เช่น ชื่อชุดข้อมูลคืออะไร, ใครเป็นเจ้าของ, อัปเดตครั้งล่าสุดเมื่อไหร่ และมีเงื่อนไขการนำไปใช้ประโยชน์อย่างไร (License)
- การนำเข้าสู่ระบบ (Ingestion): เจ้าหน้าที่ทำการสร้างชุดข้อมูล (Dataset) ใน CKAN แล้วทำการอัปโหลดไฟล์ (Resource) พร้อมกรอกรายละเอียดที่เตรียมไว้ให้ครบถ้วน

4. ยกตัวอย่างการดำเนินการ

- ข้อมูลราคากลางพัสดุ: แทนที่จะอัปโหลดไฟล์ PDF ที่สแกนจากกระดาษ เจ้าหน้าที่สารบรรณจัดทำข้อมูลลงในโปรแกรม Excel แล้วบันทึกเป็นไฟล์ .CSV จากนั้นนำขึ้นระบบ CKAN พร้อมระบุคำสำคัญ (Tag) เช่น “จัดซื้อจัดจ้าง”, “งบประมาณ”, “นขต.ทร.” เพื่อให้ง่ายต่อการสืบค้น
- ข้อมูลพยากรณ์อากาศ: เจ้าหน้าที่เทคนิคตั้งค่าให้ระบบตรวจวัดอากาศส่งข้อมูลตรงเข้าสู่ CKAN ผ่านช่องทาง API ทำให้ข้อมูลบนหน้าเว็บเป็นปัจจุบันตลอดเวลา (Real-time)
สรุปเนื้อหา
ขั้นตอนการนำเข้าข้อมูล (Data Ingestion) ไม่ใช่แค่การอัปโหลดไฟล์ทิ้งไว้ แต่คือการตั้งใจเตรียมข้อมูลให้ “พร้อมใช้” โดยเน้นไฟล์รูปแบบ Machine-Readable และการเขียน Metadata ที่ชัดเจนตามมาตรฐาน DGA ซึ่งจะช่วยให้ข้อมูลของกองทัพเรือมีคุณค่าและถูกนำไปใช้ประโยชน์ได้อย่างสูงสุดครับ
ติดตามในตอนต่อไป

ในตอนที่ 5 AdminTee จะพาไปดูภาพใหญ่ขึ้น คือการเชื่อมโยงเครือข่ายข้อมูลระหว่าง “หน่วยขึ้นตรงกองทัพเรือ (นขต.ทร.)” ว่า CKAN จะช่วยทำลายกำแพงการกักเก็บข้อมูล (Data Silo) ของแต่ละหน่วยงานได้อย่างไร ติดตามนะครับ!
ลิงก์เอกสารอ้างอิง
ลิงก์เว็บไซต์ที่เกี่ยวข้อง
- ตัวอย่างชุดข้อมูลเปิดภาครัฐ (Data.go.th)
- คู่มือการใช้งาน CKAN สำหรับผู้ดูแลข้อมูล (User Manual)
- สถาบันนวัตกรรมข้อมูลภาครัฐ (DGA)
คำถามเพื่อการมีส่วนร่วม
- ท่านพบปัญหาใดบ่อยที่สุดในการเตรียมไฟล์ข้อมูลจากเอกสารกระดาษให้เป็นไฟล์ Excel?
- ท่านคิดว่า “คำสำคัญ” (Tag) ใดที่จะช่วยให้คนสืบค้นข้อมูลของหน่วยงานท่านได้รวดเร็วที่สุด?
- ในหน่วยงานของท่าน มีข้อมูลใดบ้างที่เหมาะกับการเชื่อมต่อแบบ API (ข้อมูลที่เปลี่ยนแปลงบ่อย) หรือไม่?

Talk is cheap. Show me the code.