สรุปกระบวนการทางวิทยาการข้อมูล
ผู้เขียนกำลังสนใจในเรื่องของการวิเคราะห์ข้อมูล แล้วเจอคอร์สสอนออนไลน์ ของมหาวิทยาลัยแห่งหนึ่ง เลยสนใจจะนำมาสรุปหัวข้อและคำค้นหาต่างๆที่จะสามารถนำไปค้นคว้าหาข้อมูลต่อไปได้
ซึ่งหัวข้อที่สำคัญๆ จะได้แก่
Cloud System
Image Detection
Pattern Recognition
Data Collection
Data Munging
Data Visualization
Exploratory Data Analysis
ซึ่ง เป็น Keywork ที่เกี่ยวข้องกับกระบวนการทาง Data Science ทั้งสิ้น ทั้งนี้ผู้เขียนจะขอสรุปเนื้อหาทั้ง 5 ขั้นตอนของกระบวนวิทยาการข้อมูล ไว้ในด้านล่างนี้ด้วย
กระบวนการทางวิทยาการข้อมูล
ในกระบวนการทางวิทยาการข้อมูลจะประกอบไปด้วย 5 ส่วนหลักๆ ได้แก่
1. การมองภาพใหญ่และการตั้งคำถาม
2. มองหาข้อมูลที่เกี่ยวข้องในการนำเข้าข้อมูล
3. เตรียมข้อมูลและทำการวิเคราะห์ข้อมูล
4. สร้างแบบจำลอง ปรับปรุงและประเมินผล
5. นำไปใช้งาน และการสื่อสารผลลัพท์
ขั้นตอนที่ 1 มองภาพใหญ่และตั้งคำถาม
- ศึกษาเป้าประสงค์ ของธุรกิจที่ทำ
- องค์กรต้องการตอบโจทย์ด้านใดหรือแก้ปัญหาใด
- กำหนดปัญหาที่น่าสนใจที่ต้องการใช้วิทยาการข้อมูลประยุกต์
- Solution ปัจจุบันเป็นอย่างไร
- ตั้งขอบเขตของปัญหา
- ความสำเร็จของโครงการวัดจากตัวชี้วัดใด
- วิเคราะห์ความเป็นไปได้และความคุ้มทุนของโครงการ
ขั้นตอนที่ 2 มองหาข้อมูลที่เกี่ยวข้องในการนำเข้าข้อมูล
- ระบุข้อมูลที่เหมาะสมกับโครงการ
- ศึกษาโครงการใกล้เคียงและ Solution เพื่อแนะแนวข้อมูลที่เหมาะสม
- ค่าใช้จ่ายในการได้ข้อมูลมา
- ออกแบบแนวทางการเก็บข้อมูล
- ดึงคุณลักษณะที่ต้องการจากข้อมูล
- การได้มาซึ่งข้อมูลมีประเด็นด้านจริยธรรมใดๆหรือไม่
- นำเข้าข้อมูลจากแหล่งข้อมูลต่างๆ
ขั้นตอนที่ 3 เตรียมข้อมูลและทำการวิเคราะห์ข้อมูล
- เตรียมข้อมูลให้เหมาะสมกับการนำมาใช้
- วิเคราะห์ข้อมูลเชิงสำรวจ
- - สร้างมโนภาพ
- - หาคำตอบทางสถิติ
- - หาความสัมพันธ์
- ทำความสะอาดข้อมูล
- แปลงข้อมูลให้อ่านง่าย
- จัดการ outlier
ขั้นตอนที่ 4 สร้างแบบจำลอง ปรับปรุงประเมินผล
- เลือกเทคนิคหรืออัลกอริทึมที่เหมาะสม
- สร้าง Baseline เพื่อเปรียบเทียบ
- สร้างแบบจำลอง หลายๆแบบจำลอง
- จูนพารามิเตอร์ที่เหมาะสมและเลือกแบบจำลองที่ดีที่สุด
- ปรับปรุงแบบจำลอง
- ประเมินผล
ขั้นตอนที่ 5 นำไปใช้งาน และการสื่อสารผลลัพท์
- รายงานและสื่อสารผลลัพท์
- ทดสอบและนำไปใช้งาน
- คอยติดตามเพื่อหาข้อมูลผิดพลาดและแนวทางปรับปรุง
สามารถอ่านเนื้อหาเพิ่มได้ที่
สรุปหน้าที่ของนักวิทยาศาสตร์ข้อมูลและกระบวนการทางวิทยาการข้อมูล
สรุปการคิดเชิงวิพากษ์ หรือ critical thinking
8 ทักษะที่จำเป็นงานด้าน AI Engineer
ฝากกดโฆษณา Google Ads สัก click เพื่อเป็นกำลังใจแก่ผู้เขียนด้วยนะครับ