สรุปกระบวนการทางวิทยาการข้อมูล

Image placeholder
แวะมาทักทายกันได้


ผู้เขียนกำลังสนใจในเรื่องของการวิเคราะห์ข้อมูล แล้วเจอคอร์สสอนออนไลน์ ของมหาวิทยาลัยแห่งหนึ่ง เลยสนใจจะนำมาสรุปหัวข้อและคำค้นหาต่างๆที่จะสามารถนำไปค้นคว้าหาข้อมูลต่อไปได้


ซึ่งหัวข้อที่สำคัญๆ จะได้แก่ 

Cloud System

Image Detection

Pattern Recognition

Data Collection

Data Munging

Data Visualization

Exploratory Data Analysis


ซึ่ง เป็น Keywork ที่เกี่ยวข้องกับกระบวนการทาง Data Science ทั้งสิ้น ทั้งนี้ผู้เขียนจะขอสรุปเนื้อหาทั้ง 5 ขั้นตอนของกระบวนวิทยาการข้อมูล ไว้ในด้านล่างนี้ด้วย


กระบวนการทางวิทยาการข้อมูล

ในกระบวนการทางวิทยาการข้อมูลจะประกอบไปด้วย 5 ส่วนหลักๆ ได้แก่

1. การมองภาพใหญ่และการตั้งคำถาม

2. มองหาข้อมูลที่เกี่ยวข้องในการนำเข้าข้อมูล

3. เตรียมข้อมูลและทำการวิเคราะห์ข้อมูล

4. สร้างแบบจำลอง ปรับปรุงและประเมินผล

5. นำไปใช้งาน และการสื่อสารผลลัพท์


ขั้นตอนที่ 1 มองภาพใหญ่และตั้งคำถาม

  • ศึกษาเป้าประสงค์ ของธุรกิจที่ทำ
  • องค์กรต้องการตอบโจทย์ด้านใดหรือแก้ปัญหาใด
  • กำหนดปัญหาที่น่าสนใจที่ต้องการใช้วิทยาการข้อมูลประยุกต์
  •  Solution ปัจจุบันเป็นอย่างไร
  • ตั้งขอบเขตของปัญหา
  • ความสำเร็จของโครงการวัดจากตัวชี้วัดใด
  • วิเคราะห์ความเป็นไปได้และความคุ้มทุนของโครงการ

ขั้นตอนที่ 2 มองหาข้อมูลที่เกี่ยวข้องในการนำเข้าข้อมูล

  • ระบุข้อมูลที่เหมาะสมกับโครงการ
  • ศึกษาโครงการใกล้เคียงและ Solution เพื่อแนะแนวข้อมูลที่เหมาะสม
  • ค่าใช้จ่ายในการได้ข้อมูลมา
  • ออกแบบแนวทางการเก็บข้อมูล
  • ดึงคุณลักษณะที่ต้องการจากข้อมูล
  • การได้มาซึ่งข้อมูลมีประเด็นด้านจริยธรรมใดๆหรือไม่
  • นำเข้าข้อมูลจากแหล่งข้อมูลต่างๆ

ขั้นตอนที่ 3 เตรียมข้อมูลและทำการวิเคราะห์ข้อมูล

  • เตรียมข้อมูลให้เหมาะสมกับการนำมาใช้
  • วิเคราะห์ข้อมูลเชิงสำรวจ
  •     - สร้างมโนภาพ
  •     - หาคำตอบทางสถิติ
  •     - หาความสัมพันธ์
  • ทำความสะอาดข้อมูล
  • แปลงข้อมูลให้อ่านง่าย
  • จัดการ outlier

ขั้นตอนที่ 4 สร้างแบบจำลอง ปรับปรุงประเมินผล

  • เลือกเทคนิคหรืออัลกอริทึมที่เหมาะสม
  • สร้าง Baseline เพื่อเปรียบเทียบ
  • สร้างแบบจำลอง หลายๆแบบจำลอง
  • จูนพารามิเตอร์ที่เหมาะสมและเลือกแบบจำลองที่ดีที่สุด
  • ปรับปรุงแบบจำลอง
  • ประเมินผล

ขั้นตอนที่ 5 นำไปใช้งาน และการสื่อสารผลลัพท์

  • รายงานและสื่อสารผลลัพท์
  • ทดสอบและนำไปใช้งาน
  • คอยติดตามเพื่อหาข้อมูลผิดพลาดและแนวทางปรับปรุง


สามารถอ่านเนื้อหาเพิ่มได้ที่

สรุปหน้าที่ของนักวิทยาศาสตร์ข้อมูลและกระบวนการทางวิทยาการข้อมูล

สรุปการคิดเชิงวิพากษ์ หรือ critical thinking

8 ทักษะที่จำเป็นงานด้าน AI Engineer

ฝากกดโฆษณา Google Ads สัก click  เพื่อเป็นกำลังใจแก่ผู้เขียนด้วยนะครับ

แวะมาทักทายกันได้
donate