ขั้นที่ 2 จาก 4
เรียบเรียงข้อมูล
จัดระเบียบข้อมูลดิบให้เป็นตาราง ไทม์ไลน์ และหมวดหมู่ ที่พร้อมนำไปวิเคราะห์
วัตถุประสงค์การเรียนรู้
ข้อมูลดิบที่รวบรวมมามักซ้ำซ้อน รูปแบบไม่ตรงกัน และไม่เรียงลำดับ ขั้นเรียบเรียงคือการทำให้สะอาด เป็นระเบียบ และเชื่อมโยงตามเวลา AI ช่วยจัดตารางและสร้างไทม์ไลน์ได้เร็ว แต่ต้องรักษาช่องแหล่งที่มาไว้ทุกแถวและตรวจว่า AI ไม่ได้เติมหรือเดาข้อมูลที่ไม่มีในต้นทาง
สาระสำคัญ
- ทำความสะอาดข้อมูลก่อน: ตัดข้อมูลซ้ำ แก้รูปแบบวันที่/ชื่อให้เป็นมาตรฐานเดียวกัน
- ทุกแถวในตารางต้องคงช่องแหล่งที่มา เพื่อตามกลับไปต้นทางได้เสมอ
- สร้างไทม์ไลน์เหตุการณ์เรียงตามเวลา ช่วยเห็นลำดับและช่องว่างของเรื่องราว
- แยกข้อเท็จจริงออกจากความเห็น/ข่าวลือตั้งแต่ขั้นจัดระเบียบ อย่าปนกัน
- ระบุช่องที่ข้อมูลขาดหาย (missing) ไว้ชัด อย่าปล่อยให้ AI เติมแทนด้วยการเดา
AI ช่วยอะไรในขั้นนี้
- แปลงข้อความยาวและไฟล์หลายรูปแบบให้เป็นตารางที่มีโครงสร้างเดียวกัน
- ตรวจหาและรวมรายการที่ซ้ำหรือสะกดต่างกันเล็กน้อยให้เป็นรายการเดียว
- จัดเรียงเหตุการณ์เป็นไทม์ไลน์ และชี้ช่วงเวลาที่ข้อมูลขาดหาย
- เสนอระบบแท็ก/หมวดหมู่เริ่มต้นที่เหมาะกับลักษณะข้อมูลของคดี
ขั้นตอนการทำงานจริง
- 1
ทำความสะอาดข้อมูลดิบ
รวมข้อมูลที่ค้นมาไว้ที่เดียว ตัดรายการซ้ำ และปรับรูปแบบวันที่ ชื่อ สถานที่ ให้เป็นมาตรฐานเดียวกัน เพื่อให้เปรียบเทียบและจัดเรียงได้
- 2
จัดเป็นตารางมาตรฐาน
แปลงข้อความยาว ๆ ให้เป็นตารางที่มีคอลัมน์ชัด เช่น วันที่ เหตุการณ์ บุคคลที่เกี่ยวข้อง แหล่งที่มา ทำให้นำไปวิเคราะห์ต่อได้สะดวก
ตัวอย่าง Promptช่วยแปลงข้อมูลดิบต่อไปนี้ให้เป็นตารางมาตรฐาน: [วางตารางข้อมูล/ข้อความดิบ] คอลัมน์ที่ต้องการ: วันที่ | เหตุการณ์ | บุคคล/นิติบุคคลที่เกี่ยวข้อง | สถานที่ | แหล่งที่มา ข้อกำหนด: 1. คงแหล่งที่มาเดิมของทุกแถว ห้ามตัดทิ้ง 2. ถ้าช่องใดไม่มีข้อมูลในต้นทาง ให้ใส่ว่า “ไม่ระบุ” ห้ามเดาหรือเติมเอง 3. จัดรูปแบบวันที่เป็น วว/ดด/ปปปป ให้เหมือนกันทุกแถว 4. ใช้ชื่อสมมุติตามต้นทาง เช่น นาย ก. นาง ข. อย่าเปลี่ยนชื่อ
- 3
สร้างไทม์ไลน์เหตุการณ์
เรียงเหตุการณ์ตามลำดับเวลา เพื่อให้เห็นภาพรวมว่าเรื่องเกิดอะไรก่อนหลัง และมีช่วงเวลาใดที่ข้อมูลขาดหายไปบ้าง
ตัวอย่าง Promptจากตารางเหตุการณ์นี้ ช่วยจัดทำไทม์ไลน์เรียงตามเวลา: [วางตารางข้อมูล] รูปแบบที่ต้องการ: วันที่/เวลา → เหตุการณ์ (อ้างอิงแหล่ง) ข้อกำหนด: 1. เรียงจากเก่าไปใหม่ 2. ทำเครื่องหมาย [ช่องว่าง] ระหว่างเหตุการณ์ที่เวลาห่างกันผิดปกติ 3. แยกเหตุการณ์ที่ “ยืนยันแล้ว” ออกจาก “ยังไม่ยืนยัน” 4. ห้ามเพิ่มเหตุการณ์ที่ไม่มีในตารางต้นทาง
- 4
จัดหมวดหมู่และแท็ก
ติดแท็กข้อมูลตามหัวข้อ เช่น บุคคล สถานที่ ยานพาหนะ การเงิน เพื่อให้ดึงกลุ่มข้อมูลที่เกี่ยวข้องมาวิเคราะห์ในขั้นถัดไปได้เร็ว
ข้อควรระวัง / กับดักที่พบบ่อย
- AI อาจเติมข้อมูลในช่องว่างด้วยการเดา (สรุปเกินข้อมูล) ต้องสั่งให้ใส่ “ไม่ระบุ” แทนการคาดเดา
- การจัดรูปวันที่ผิดอาจทำให้ไทม์ไลน์เพี้ยน ต้องสุ่มตรวจหลายแถวเทียบกับต้นทาง
- อย่าให้ AI ลบข้อมูลที่ดู “ไม่สำคัญ” ออกเอง เพราะอาจเป็นชิ้นส่วนสำคัญที่ยังไม่เห็นค่า
- ระวังการสูญเสียช่องแหล่งที่มาเมื่อแปลงรูปข้อมูลหลายครั้ง ให้ตรวจว่าทุกแถวยังอ้างต้นทางได้
ตัวอย่างการแยกข้อมูล (ข้อมูลจำลอง)
ตัวอย่างการแยกข้อมูล (Verification First)
ข้อมูลจำลองเพื่อการสอน — ไม่ใช่คดีจริงข้อเท็จจริง
ตรวจสอบได้ / มีหลักฐาน
- มีธุรกรรมโอนเงินจากบัญชี XXX-X-XXXXX-X ไปยังบัญชีปลายทาง 3 ครั้งในเดือนเดียวกัน (แหล่ง: เอกสารสมมุติประกอบคดีจำลองที่ 00/2569)
- ไทม์ไลน์แสดงว่าการโอนทั้ง 3 ครั้งเกิดหลังการประชุมระหว่าง นาย ก. กับ นาง ข. ที่ย่านสมมุติ A
บทวิเคราะห์
การตีความจากข้อเท็จจริง
- ลำดับเวลา “ประชุมแล้วจึงโอน” อาจบ่งชี้ความเชื่อมโยงระหว่างการพบกันกับธุรกรรม (เป็นการตีความจากลำดับเวลา ยังไม่ใช่ข้อสรุป)
- การโอนเป็นงวดถี่ในเดือนเดียวอาจเป็นรูปแบบการชำระตามข้อตกลง หรือเป็นการแบ่งยอด (สองความเป็นไปได้ ยังไม่ยืนยัน)
ข้อสงสัย
ยังคลุมเครือ / อาจผิดได้
- ไม่ทราบว่าบัญชีปลายทางเป็นของใคร และเกี่ยวข้องกับ บริษัท ตัวอย่างการค้า จำกัด หรือไม่
- ไม่มีหลักฐานยืนยันว่าการประชุมกับการโอนเงินเป็นเรื่องเดียวกัน
ต้องตรวจสอบเพิ่ม
งานที่ต้องทำต่อก่อนสรุป
- ตรวจรายการเดินบัญชีฉบับเต็มผ่านช่องทางที่ถูกต้องตามกฎหมาย
- ยืนยันตัวตนเจ้าของบัญชีปลายทาง
- หาหลักฐานประกอบว่าการประชุมเกี่ยวข้องกับธุรกรรมหรือไม่ (เช่น เอกสาร ข้อความ)
เช็กลิสต์ท้ายบท
ติ๊กเพื่อทบทวนก่อนไปขั้นต่อไป (ติ๊กชั่วคราวในหน้านี้)