จากการทำโปรเจคทางด้าน Data Science ที่ผ่านมามักจะพบบุคคล (อย่างน้อย) 3 ฝ่ายที่เกี่ยวข้องครับ นั่นคือ

1. Business Person
เป็นผู้เชี่ยวชาญในด้านธุรกิจที่เกี่ยวข้องและจะเป็นผู้อธิบายเงื่อนไข สิ่งที่ต้องการจะได้จากโปรเจค

2. IT Person
เป็นผู้ที่ดูแล Infrastructure ของบริษัท จะต้องอธิบายเรื่องที่เก็บข้อมูลต่างๆ และวางแผนการนำผลที่ได้ไปจัดการต่อ

3. Data Analyst
เป็นผู้ที่ทำการวิเคราะห์ข้อมูลเพื่อให้ได้ผลลัพธ์ตามที่ผู้เชี่ยวชาญด้านธุรกิจต้องการ

ซึ่ง 3 ฝ่ายนี้มีส่วนเกี่ยวข้องในขั้นตอนต่างๆ ของ กระบวนการ CRISP-DM ที่เป็นแนวทางหลักในการวิเคราะห์ข้อมูลครับ ผมขอทวนขั้นตอนของ CRISP-DM อีกครั้งว่าคือออะไร ส่วนรายละเอียดย่อยๆ แต่ละขั้นตอนและฝ่ายที่เกี่ยวข้องดูจากรูปภาพได้เลยครับ


CRISP-DM เป็นกระบวนการในการวิเคราะห์ที่ใช้กันอย่างแพร่หลายซึ่งประกอบด้วย 6 ขั้นตอนได้แก่

1. Business Understanding
เป็นขั้นตอนการทำความเข้าใจโจทย์ทางธุรกิจหรือกำหนดวัตถุประสงค์ของโปรเจคการวิเคราะห์ข้อมูล

2. Data Understanding
เป็นขั้นตอนการดูว่ามีข้อมูลอะไรบ้างที่สามารถนำมาใช้ในการวิเคราะห์ของโปรเจคนี้ได้บ้าง

3. Data Preparation
เป็นขั้นตอนของการเตรียมข้อมูลโดยอาจจะเป็นการเชื่อมโยงข้อมูล (join) ในฐานข้อมูลต่างๆ หรือการสร้างตัวแปรใหม่ (derived variable) สำหรับการวิเคราะห์ข้อมูลในโปรเจคนี้

4. Modeling
เป็นขั้นตอนการวิเคราะห์ข้อมูลโดยการใช้เทคนิคต่างๆ ของ Data Mining หรือ Machine Learning 

5. Evaluation
เป็นขั้นตอนการวัดผลลัพธ์ที่ได้จากการวิเคราะห์ว่าตอบโจทย์ในขั้นตอนแรกหรือไม่ ถ้ายังไม่ตอบโจทย์สามารถวนกลับไปแก้ไขขั้นตอนก่อนหน้าได้ครับ

6. Deployment
เป็นขั้นตอนการนำผลลัพธ์การวิเคราะห์ที่ได้ไปใช้งานต่อไป เช่น เสนอชื่อลูกค้าให้กับฝ่ายการตลาดเพื่อทำการติดต่อต่อไป

#datamining #crispdm #dataanalytics #datacube

บุคคลที่เกี่ยวข้องกับการทำโปรเจคทาง Data Science

Leave a Reply

Your email address will not be published. Required fields are marked *