Summary Note บทที่ 1 จากหลักสูตร Practical Data Mining with RapidMiner Studio 9

หลักสูตร Practical Data Mining with RapidMiner Studio 9 นี้เป็นหลักสูตรที่เน้นอธิบาย 2 ส่วนคือ concept ของการวิเคราะห์ข้อมูลและการใช้งานซอฟต์แวร์ RapidMiner Studio 9 ครับ ในโพสต์นี้จะเป็นสรุปในบทที่ 1 ของหลักสูตรนี้ซึ่งเนื้อหาจะเกี่ยวกับ…

Continue Reading →

ขั้นตอนการสร้างโมเดล Decision Tree

เทคนิค Decision Tree เป็นเทคนิคหนึ่งที่ได้รับความนิยมในการนำมาประยุกต์ใชัในงานด้าน data mining วันนี้ผมจะแนะนำการสร้างโมเดล decision tree แบบง่ายๆ ก่อนอื่นเราจะใช้ข้อมูลในตารางที่ 1 ซึ่งเป็นข้อมูลที่เก็บสภาพภูมิอากาศ 14 วันย้อนหลังเพื่อดูว่าจะมีการจัดแข่งขันกีฬาหรือไม่ ตารางที่ 1 แสดงข้อมูล weather จากข้อมูลในตารางที่…

Continue Reading →

ระดับของการวิเคราะห์ข้อมูล (Data Analytics)

ในการทำ Data Analytics หรือ Data Driven Markeing เป็นการนำข้อมูลมาช่วยในการตัดสินใจเพื่อให้มีความแม่นยำและถูกต้องมากขึ้น รูปนี้เป็นรูปที่ผมมักจะใช้ในการอธิบายเรื่องระดับของการวิเคราะห์ข้อมูล (Data Analytics) โดยในรูปจะเริ่มตั้งแต่ข้อมูล (Data) ไปจนถึงการตัดสินใจ (Decision) หรือการกระทำ (Action) โดยในรูปจะแสดงระดับในการวิเคราะห์ข้อมูลต่างๆ ซึ่งมีรายละเอียดดังนี้ การวิเคราะห์ข้อมูลแบบ…

Continue Reading →

บุคคลที่เกี่ยวข้องกับการทำโปรเจคทาง Data Science

จากการทำโปรเจคทางด้าน Data Science ที่ผ่านมามักจะพบบุคคล (อย่างน้อย) 3 ฝ่ายที่เกี่ยวข้องครับ นั่นคือ 1. Business Person เป็นผู้เชี่ยวชาญในด้านธุรกิจที่เกี่ยวข้องและจะเป็นผู้อธิบายเงื่อนไข สิ่งที่ต้องการจะได้จากโปรเจค 2. IT Person เป็นผู้ที่ดูแล Infrastructure ของบริษัท จะต้องอธิบายเรื่องที่เก็บข้อมูลต่างๆ…

Continue Reading →

ดาวน์โหลดสไลด์ของหนังสือ Introduction to Data Mining ได้ฟรี

ดาวน์โหลดสไลด์ของหนังสือ Introduction to Data Mining ได้จาก https://www-users.cs.umn.edu/~kumar001/dmbook/index.php ครับ มีหัวข้อดังนี้ครับ1. Introduction.2. Data3. Classification: Basic Concepts and Techniques– Basic Concepts and Decision Trees– Model Overfitting4.…

Continue Reading →

เว็บไซต์ที่รวบรวมงานวิจัยทางด้าน Machine Learning และมี Code ที่ใช้ในการทำวิจัยด้วย

เว็บไซต์ paperswithcode.com เป็นเว็บไซต์ที่รวบรวมงานวิจัยทางด้าน Machine Learning และมี Code ที่ใช้ในการทำวิจัยให้ดาวน์โหลดด้วยครับ เช่น Deep Learning แบบต่างๆ และมีหัวข้อวิจัยแยกเป็นเรื่องต่างๆ ดังนี้ครับ– Computer Vision– Natural Language Processing– Medical– Graph– Speech–…

Continue Reading →

การประยุกต์ใช้ Predictive Modeling ในเชิงธุรกิจ (Business)

ในหลายๆ ครั้งเวลาทำงานเรามักจะต้องหาก่อนว่าจะนำข้อมูลที่มีมาใช้ในการวิเคราะห์เรื่องอะไรบ้างครับ รูปด้านล่างแสดงตัวอย่างการนำเทคนิคการวิเคราะห์ข้อมูลแบบ Predictive Modeling ไปใช้ในเชิงธุรกิจ ได้แก่ Customer recruitment from a prospect database คือ การหาว่าลูกค้าเป้าหมาย (prospects) คนใดบ้างที่มีโอกาสจะซื้อสินค้าหรือบริการมากสุด Cross-sell/up-sell campaign เป็นการหาว่าลูกค้าคนใดบ้างที่เคยซื้อสินค้า…

Continue Reading →

เปรียบเทียบความถูกต้อง (Accuracy) กับการแปลความ (Explainability) ของโมเดลต่างๆ

ในการสร้างโมเดล Classification นั้นมีหลายเทคนิคครับ บางเทคนิคก็แปลความ (Explainability) ได้ง่าย บางเทคนิคก็แปลความยากแต่ความถูกต้อง (Accuracy) สูงครับ ภาพด้านล่างเป็นการแสดงให้เห็นว่าเทคนิคต่างๆ นั้นสามารถอธิบายได้ง่ายหรือยากและมีความถูกต้องมากน้อยแค่ไหนครับ  โดยเทคนิคต่างๆ มีดังนี้ครับ 1. Linear Regressionเป็นการสร้างสมการเส้นตรง (เช่น y = mx+c)…

Continue Reading →

ข้อมูลที่ได้จากการซื้อสินค้าแต่ละครั้ง

ในการวิเคราะห์ข้อมูลบางครั้งเราอาจจะไม่สามารถใช้ข้อมูลที่มีได้โดยตรง อาจจะต้องสร้างตัวแแปรใหม่ (derived variable) ขึ้นมา รูปด้านล่างแสดงให้เห็นว่าจากข้อมูลการซื้อสินค้าแต่ละครั้งเราสามารถได้ข้อมูลอะไรมาช่วยในการวิเคราะห์ข้อมูลได้บ้าง  หมายเหตุ อันนี้ยังไม่ได้พิจารณาเรื่อง PDPA นะครับ

Continue Reading →

การเปลี่ยนแปลงการวิเคราะห์ข้อมูล (Data Analytics) ในช่วงต่างๆ

ภาพด้านล่างแสดงการเปลี่ยนแปลงของการวิเคราะห์ข้อมูล (Analytics) ในช่วงตั้งแต่ประมาณปี 2005 เป็นต้นมา (อ้างอิงจากหนังสือ Competing on Analytics: The New Science of Winning, 2nd Edition)  Analytics 1.0 ช่วงนี้เน้นการวิเคราะห์ข้อมูลเพื่อสนับสนุนการตัดสินใจ (Decision Support)…

Continue Reading →