ระดับของการวิเคราะห์ข้อมูล (Data Analytics)

ในการทำ Data Analytics หรือ Data Driven Markeing เป็นการนำข้อมูลมาช่วยในการตัดสินใจเพื่อให้มีความแม่นยำและถูกต้องมากขึ้น รูปนี้เป็นรูปที่ผมมักจะใช้ในการอธิบายเรื่องระดับของการวิเคราะห์ข้อมูล (Data Analytics) โดยในรูปจะเริ่มตั้งแต่ข้อมูล (Data) ไปจนถึงการตัดสินใจ (Decision) หรือการกระทำ (Action) โดยในรูปจะแสดงระดับในการวิเคราะห์ข้อมูลต่างๆ ซึ่งมีรายละเอียดดังนี้ การวิเคราะห์ข้อมูลแบบ…

Continue Reading →

บุคคลที่เกี่ยวข้องกับการทำโปรเจคทาง Data Science

จากการทำโปรเจคทางด้าน Data Science ที่ผ่านมามักจะพบบุคคล (อย่างน้อย) 3 ฝ่ายที่เกี่ยวข้องครับ นั่นคือ 1. Business Person เป็นผู้เชี่ยวชาญในด้านธุรกิจที่เกี่ยวข้องและจะเป็นผู้อธิบายเงื่อนไข สิ่งที่ต้องการจะได้จากโปรเจค 2. IT Person เป็นผู้ที่ดูแล Infrastructure ของบริษัท จะต้องอธิบายเรื่องที่เก็บข้อมูลต่างๆ…

Continue Reading →

ดาวน์โหลดสไลด์ของหนังสือ Introduction to Data Mining ได้ฟรี

ดาวน์โหลดสไลด์ของหนังสือ Introduction to Data Mining ได้จาก https://www-users.cs.umn.edu/~kumar001/dmbook/index.php ครับ มีหัวข้อดังนี้ครับ1. Introduction.2. Data3. Classification: Basic Concepts and Techniques– Basic Concepts and Decision Trees– Model Overfitting4.…

Continue Reading →

เว็บไซต์ที่รวบรวมงานวิจัยทางด้าน Machine Learning และมี Code ที่ใช้ในการทำวิจัยด้วย

เว็บไซต์ paperswithcode.com เป็นเว็บไซต์ที่รวบรวมงานวิจัยทางด้าน Machine Learning และมี Code ที่ใช้ในการทำวิจัยให้ดาวน์โหลดด้วยครับ เช่น Deep Learning แบบต่างๆ และมีหัวข้อวิจัยแยกเป็นเรื่องต่างๆ ดังนี้ครับ– Computer Vision– Natural Language Processing– Medical– Graph– Speech–…

Continue Reading →

การประยุกต์ใช้ Predictive Modeling ในเชิงธุรกิจ (Business)

ในหลายๆ ครั้งเวลาทำงานเรามักจะต้องหาก่อนว่าจะนำข้อมูลที่มีมาใช้ในการวิเคราะห์เรื่องอะไรบ้างครับ รูปด้านล่างแสดงตัวอย่างการนำเทคนิคการวิเคราะห์ข้อมูลแบบ Predictive Modeling ไปใช้ในเชิงธุรกิจ ได้แก่ Customer recruitment from a prospect database คือ การหาว่าลูกค้าเป้าหมาย (prospects) คนใดบ้างที่มีโอกาสจะซื้อสินค้าหรือบริการมากสุด Cross-sell/up-sell campaign เป็นการหาว่าลูกค้าคนใดบ้างที่เคยซื้อสินค้า…

Continue Reading →

เปรียบเทียบความถูกต้อง (Accuracy) กับการแปลความ (Explainability) ของโมเดลต่างๆ

ในการสร้างโมเดล Classification นั้นมีหลายเทคนิคครับ บางเทคนิคก็แปลความ (Explainability) ได้ง่าย บางเทคนิคก็แปลความยากแต่ความถูกต้อง (Accuracy) สูงครับ ภาพด้านล่างเป็นการแสดงให้เห็นว่าเทคนิคต่างๆ นั้นสามารถอธิบายได้ง่ายหรือยากและมีความถูกต้องมากน้อยแค่ไหนครับ  โดยเทคนิคต่างๆ มีดังนี้ครับ 1. Linear Regressionเป็นการสร้างสมการเส้นตรง (เช่น y = mx+c)…

Continue Reading →

ข้อมูลที่ได้จากการซื้อสินค้าแต่ละครั้ง

ในการวิเคราะห์ข้อมูลบางครั้งเราอาจจะไม่สามารถใช้ข้อมูลที่มีได้โดยตรง อาจจะต้องสร้างตัวแแปรใหม่ (derived variable) ขึ้นมา รูปด้านล่างแสดงให้เห็นว่าจากข้อมูลการซื้อสินค้าแต่ละครั้งเราสามารถได้ข้อมูลอะไรมาช่วยในการวิเคราะห์ข้อมูลได้บ้าง  หมายเหตุ อันนี้ยังไม่ได้พิจารณาเรื่อง PDPA นะครับ

Continue Reading →

การเปลี่ยนแปลงการวิเคราะห์ข้อมูล (Data Analytics) ในช่วงต่างๆ

ภาพด้านล่างแสดงการเปลี่ยนแปลงของการวิเคราะห์ข้อมูล (Analytics) ในช่วงตั้งแต่ประมาณปี 2005 เป็นต้นมา (อ้างอิงจากหนังสือ Competing on Analytics: The New Science of Winning, 2nd Edition)  Analytics 1.0 ช่วงนี้เน้นการวิเคราะห์ข้อมูลเพื่อสนับสนุนการตัดสินใจ (Decision Support)…

Continue Reading →

เริ่มต้นโปรเจคทาง Data Analytics ด้วยเรื่องเล็กๆ เสียก่อน

คำพูดนี้เป็นของ Head of Customer Relationship Management ของบริษัทผลิตเครื่องแต่งกายที่เป็นพวกยีนส์ต่างๆ ซึ่งตั้งอยู่ในประเทศตุรกี บริษัทได้เริ่มใช้การวิเคราะห์ข้อมูลในช่วงประมาณปี 2009 ครับ โดยทำการแบ่งกลุ่มลูกค้าออกมาตามพฤติกรรมการซื้อสินค้าได้ออกมาเป็น 3 กลุ่ม คือ กลุ่มที่ 1 คือ กลุ่มที่ชอบซื้อเสื้อเชิร์ตกลุ่มที่ 2…

Continue Reading →

ความแตกต่างระหว่าง Business Intelligence และ Data Mining

รูปด้านล่างอธิบายความแตกต่างของ BI (Business Intelligence) และ Data Mining หรือ Machine Learning ครับ ในรูปผมแสดงการเปรียบเทียบใน 2 มุมมองคือ แกนนอน (แกน X) เป็นเรื่องของช่วงเวลาซึ่งตรงกลางคือเวลาปัจจุบัน และทางซ้ายมือคือเวลาในอดีต ส่วนด้านขวามือคือเวลาที่จะเกิดขึ้นในอนาคตครับ อีกแกน…

Continue Reading →