จากการทำโปรเจคทางด้าน Data Science ที่ผ่านมามักจะพบบุคคล (อย่างน้อย) 3 ฝ่ายที่เกี่ยวข้องครับ นั่นคือ
1. Business Person
เป็นผู้เชี่ยวชาญในด้านธุรกิจที่เกี่ยวข้องและจะเป็นผู้อธิบายเงื่อนไข สิ่งที่ต้องการจะได้จากโปรเจค
2. IT Person
เป็นผู้ที่ดูแล Infrastructure ของบริษัท จะต้องอธิบายเรื่องที่เก็บข้อมูลต่างๆ และวางแผนการนำผลที่ได้ไปจัดการต่อ
3. Data Analyst
เป็นผู้ที่ทำการวิเคราะห์ข้อมูลเพื่อให้ได้ผลลัพธ์ตามที่ผู้เชี่ยวชาญด้านธุรกิจต้องการ

ซึ่ง 3 ฝ่ายนี้มีส่วนเกี่ยวข้องในขั้นตอนต่างๆ ของ กระบวนการ CRISP-DM ที่เป็นแนวทางหลักในการวิเคราะห์ข้อมูลครับ ผมขอทวนขั้นตอนของ CRISP-DM อีกครั้งว่าคือออะไร ส่วนรายละเอียดย่อยๆ แต่ละขั้นตอนและฝ่ายที่เกี่ยวข้องดูจากรูปภาพได้เลยครับ



CRISP-DM เป็นกระบวนการในการวิเคราะห์ที่ใช้กันอย่างแพร่หลายซึ่งประกอบด้วย 6 ขั้นตอนได้แก่
1. Business Understanding
เป็นขั้นตอนการทำความเข้าใจโจทย์ทางธุรกิจหรือกำหนดวัตถุประสงค์ของโปรเจคการวิเคราะห์ข้อมูล
2. Data Understanding
เป็นขั้นตอนการดูว่ามีข้อมูลอะไรบ้างที่สามารถนำมาใช้ในการวิเคราะห์ของโปรเจคนี้ได้บ้าง
3. Data Preparation
เป็นขั้นตอนของการเตรียมข้อมูลโดยอาจจะเป็นการเชื่อมโยงข้อมูล (join) ในฐานข้อมูลต่างๆ หรือการสร้างตัวแปรใหม่ (derived variable) สำหรับการวิเคราะห์ข้อมูลในโปรเจคนี้
4. Modeling
เป็นขั้นตอนการวิเคราะห์ข้อมูลโดยการใช้เทคนิคต่างๆ ของ Data Mining หรือ Machine Learning
5. Evaluation
เป็นขั้นตอนการวัดผลลัพธ์ที่ได้จากการวิเคราะห์ว่าตอบโจทย์ในขั้นตอนแรกหรือไม่ ถ้ายังไม่ตอบโจทย์สามารถวนกลับไปแก้ไขขั้นตอนก่อนหน้าได้ครับ
6. Deployment
เป็นขั้นตอนการนำผลลัพธ์การวิเคราะห์ที่ได้ไปใช้งานต่อไป เช่น เสนอชื่อลูกค้าให้กับฝ่ายการตลาดเพื่อทำการติดต่อต่อไป