ข้ามไปยังเนื้อหา
← กลับไปบทเรียนทั้งหมด

ขั้นที่ 2 จาก 4

เรียบเรียงข้อมูล

จัดระเบียบข้อมูลดิบให้เป็นตาราง ไทม์ไลน์ และหมวดหมู่ ที่พร้อมนำไปวิเคราะห์

วัตถุประสงค์การเรียนรู้

ผู้เรียนสามารถทำความสะอาดข้อมูลดิบ จัดหมวดหมู่ สร้างไทม์ไลน์เหตุการณ์ และแปลงข้อมูลกระจัดกระจายให้เป็นตารางมาตรฐานที่อ้างอิงแหล่งที่มาได้

ข้อมูลดิบที่รวบรวมมามักซ้ำซ้อน รูปแบบไม่ตรงกัน และไม่เรียงลำดับ ขั้นเรียบเรียงคือการทำให้สะอาด เป็นระเบียบ และเชื่อมโยงตามเวลา AI ช่วยจัดตารางและสร้างไทม์ไลน์ได้เร็ว แต่ต้องรักษาช่องแหล่งที่มาไว้ทุกแถวและตรวจว่า AI ไม่ได้เติมหรือเดาข้อมูลที่ไม่มีในต้นทาง

สาระสำคัญ

  • ทำความสะอาดข้อมูลก่อน: ตัดข้อมูลซ้ำ แก้รูปแบบวันที่/ชื่อให้เป็นมาตรฐานเดียวกัน
  • ทุกแถวในตารางต้องคงช่องแหล่งที่มา เพื่อตามกลับไปต้นทางได้เสมอ
  • สร้างไทม์ไลน์เหตุการณ์เรียงตามเวลา ช่วยเห็นลำดับและช่องว่างของเรื่องราว
  • แยกข้อเท็จจริงออกจากความเห็น/ข่าวลือตั้งแต่ขั้นจัดระเบียบ อย่าปนกัน
  • ระบุช่องที่ข้อมูลขาดหาย (missing) ไว้ชัด อย่าปล่อยให้ AI เติมแทนด้วยการเดา

AI ช่วยอะไรในขั้นนี้

  • แปลงข้อความยาวและไฟล์หลายรูปแบบให้เป็นตารางที่มีโครงสร้างเดียวกัน
  • ตรวจหาและรวมรายการที่ซ้ำหรือสะกดต่างกันเล็กน้อยให้เป็นรายการเดียว
  • จัดเรียงเหตุการณ์เป็นไทม์ไลน์ และชี้ช่วงเวลาที่ข้อมูลขาดหาย
  • เสนอระบบแท็ก/หมวดหมู่เริ่มต้นที่เหมาะกับลักษณะข้อมูลของคดี

ขั้นตอนการทำงานจริง

  1. 1

    ทำความสะอาดข้อมูลดิบ

    รวมข้อมูลที่ค้นมาไว้ที่เดียว ตัดรายการซ้ำ และปรับรูปแบบวันที่ ชื่อ สถานที่ ให้เป็นมาตรฐานเดียวกัน เพื่อให้เปรียบเทียบและจัดเรียงได้

  2. 2

    จัดเป็นตารางมาตรฐาน

    แปลงข้อความยาว ๆ ให้เป็นตารางที่มีคอลัมน์ชัด เช่น วันที่ เหตุการณ์ บุคคลที่เกี่ยวข้อง แหล่งที่มา ทำให้นำไปวิเคราะห์ต่อได้สะดวก

    ตัวอย่าง Prompt
    ช่วยแปลงข้อมูลดิบต่อไปนี้ให้เป็นตารางมาตรฐาน:
    [วางตารางข้อมูล/ข้อความดิบ]
    คอลัมน์ที่ต้องการ: วันที่ | เหตุการณ์ | บุคคล/นิติบุคคลที่เกี่ยวข้อง | สถานที่ | แหล่งที่มา
    ข้อกำหนด:
    1. คงแหล่งที่มาเดิมของทุกแถว ห้ามตัดทิ้ง
    2. ถ้าช่องใดไม่มีข้อมูลในต้นทาง ให้ใส่ว่า “ไม่ระบุ” ห้ามเดาหรือเติมเอง
    3. จัดรูปแบบวันที่เป็น วว/ดด/ปปปป ให้เหมือนกันทุกแถว
    4. ใช้ชื่อสมมุติตามต้นทาง เช่น นาย ก. นาง ข. อย่าเปลี่ยนชื่อ
  3. 3

    สร้างไทม์ไลน์เหตุการณ์

    เรียงเหตุการณ์ตามลำดับเวลา เพื่อให้เห็นภาพรวมว่าเรื่องเกิดอะไรก่อนหลัง และมีช่วงเวลาใดที่ข้อมูลขาดหายไปบ้าง

    ตัวอย่าง Prompt
    จากตารางเหตุการณ์นี้ ช่วยจัดทำไทม์ไลน์เรียงตามเวลา:
    [วางตารางข้อมูล]
    รูปแบบที่ต้องการ: วันที่/เวลา → เหตุการณ์ (อ้างอิงแหล่ง)
    ข้อกำหนด:
    1. เรียงจากเก่าไปใหม่
    2. ทำเครื่องหมาย [ช่องว่าง] ระหว่างเหตุการณ์ที่เวลาห่างกันผิดปกติ
    3. แยกเหตุการณ์ที่ “ยืนยันแล้ว” ออกจาก “ยังไม่ยืนยัน”
    4. ห้ามเพิ่มเหตุการณ์ที่ไม่มีในตารางต้นทาง
  4. 4

    จัดหมวดหมู่และแท็ก

    ติดแท็กข้อมูลตามหัวข้อ เช่น บุคคล สถานที่ ยานพาหนะ การเงิน เพื่อให้ดึงกลุ่มข้อมูลที่เกี่ยวข้องมาวิเคราะห์ในขั้นถัดไปได้เร็ว

ข้อควรระวัง / กับดักที่พบบ่อย

  • AI อาจเติมข้อมูลในช่องว่างด้วยการเดา (สรุปเกินข้อมูล) ต้องสั่งให้ใส่ “ไม่ระบุ” แทนการคาดเดา
  • การจัดรูปวันที่ผิดอาจทำให้ไทม์ไลน์เพี้ยน ต้องสุ่มตรวจหลายแถวเทียบกับต้นทาง
  • อย่าให้ AI ลบข้อมูลที่ดู “ไม่สำคัญ” ออกเอง เพราะอาจเป็นชิ้นส่วนสำคัญที่ยังไม่เห็นค่า
  • ระวังการสูญเสียช่องแหล่งที่มาเมื่อแปลงรูปข้อมูลหลายครั้ง ให้ตรวจว่าทุกแถวยังอ้างต้นทางได้

ตัวอย่างการแยกข้อมูล (ข้อมูลจำลอง)

ตัวอย่างการแยกข้อมูล (Verification First)

ข้อเท็จจริง

ตรวจสอบได้ / มีหลักฐาน

  • มีธุรกรรมโอนเงินจากบัญชี XXX-X-XXXXX-X ไปยังบัญชีปลายทาง 3 ครั้งในเดือนเดียวกัน (แหล่ง: เอกสารสมมุติประกอบคดีจำลองที่ 00/2569)
  • ไทม์ไลน์แสดงว่าการโอนทั้ง 3 ครั้งเกิดหลังการประชุมระหว่าง นาย ก. กับ นาง ข. ที่ย่านสมมุติ A

บทวิเคราะห์

การตีความจากข้อเท็จจริง

  • ลำดับเวลา “ประชุมแล้วจึงโอน” อาจบ่งชี้ความเชื่อมโยงระหว่างการพบกันกับธุรกรรม (เป็นการตีความจากลำดับเวลา ยังไม่ใช่ข้อสรุป)
  • การโอนเป็นงวดถี่ในเดือนเดียวอาจเป็นรูปแบบการชำระตามข้อตกลง หรือเป็นการแบ่งยอด (สองความเป็นไปได้ ยังไม่ยืนยัน)

ข้อสงสัย

ยังคลุมเครือ / อาจผิดได้

  • ไม่ทราบว่าบัญชีปลายทางเป็นของใคร และเกี่ยวข้องกับ บริษัท ตัวอย่างการค้า จำกัด หรือไม่
  • ไม่มีหลักฐานยืนยันว่าการประชุมกับการโอนเงินเป็นเรื่องเดียวกัน

ต้องตรวจสอบเพิ่ม

งานที่ต้องทำต่อก่อนสรุป

  • ตรวจรายการเดินบัญชีฉบับเต็มผ่านช่องทางที่ถูกต้องตามกฎหมาย
  • ยืนยันตัวตนเจ้าของบัญชีปลายทาง
  • หาหลักฐานประกอบว่าการประชุมเกี่ยวข้องกับธุรกรรมหรือไม่ (เช่น เอกสาร ข้อความ)

เช็กลิสต์ท้ายบท

ติ๊กเพื่อทบทวนก่อนไปขั้นต่อไป (ติ๊กชั่วคราวในหน้านี้)