20 ปีในเส้นทางสาย Data

เมื่อวานนี้มีน้องที่รู้จักกันมาถามว่า “ผมยังไม่รู้ inspiration ของพี่เลยว่าทำไมพี่ถึงชอบ Data” ถ้าให้ตอบแบบเท่ๆ สมัยนี้ก็ต้องบอกว่า “เพราะข้อมูลมันมีประโยชน์ไง ช่วยให้เราตัดสินใจได้ดีขึ้น …” แต่จริงๆ จุดเริ่มต้นของผมในเส้นทางสายนี้ไม่ใช่เพราะคำตอบนั้นหรอกครับ จากคำถามนั้นก็เลยทำให้ผมคิดย้อนไปว่าเส้นทางด้านนี้ของผมเป็นยังไง จริงๆ ถ้าคุณอ่านบทความนี้อาจจะรู้จักผมกับดาต้า คิวบ์มาบ้าง แต่ขออนุญาตย้อนกลับไปตอนจุดเริ่มต้นของเส้นทางการเดินทางของผมสักนิดนึงนะครับ ผมรู้จักกับ Data Mining…

Continue Reading →

Use-case: Churn Prevention

การรักษาลูกค้าให้ซื้อสินค้าหรือใช้บริการของบริษัทต่อไปเป็นเรื่องสำคัญที่จะทำให้บริษัทสามารถดำเนินธุรกิจและเติบโตต่อไปได้อย่างต่อเนื่องครับ และจากการวิจัยพบว่าการหาลูกค้าใหม่อาจจะมีค่าใช้จ่ายมากกว่าการรักษาลูกค้าเดิมสูงถึงประมาณ 5-10 เท่าเลยทีเดียว โดยเฉพาะยิ่งเป็นลูกค้าที่มูลค่ากับบริษัทมากๆ แล้วด้วยยิ่งไม่อยากเสียไปใช่ไหมครับ ดังนั้นบริษัทจึงให้ความสนใจกับการรักษาฐานลูกค้าเดิมไว้มากกว่าเพราะเมื่อลูกค้าไม่ซื้อสินค้าหรือใช้บริการแล้วย่อมส่งผลกระทบกับบริษัทอย่างแน่นอน สำหรับบางธุรกิจแล้วสักวันหนึ่งลูกค้าก็ต้องมีการเลิกใช้บริการอยู่ดีซึ่งลักษณะนี้จะเรียกว่าเป็น Expected Churn คือ บริษัทจะสามารถคาดการณ์ได้ว่าลูกค้าต้องไม่ใช้บริการเมื่อไร ตัวอย่างเช่น ในครอบครัวที่มีลูกน้อยซึ่งเพิ่งเกิดได้ไม่นาน ครอบครัวนี้ก็เป็นลูกค้าของบริษัทผ้าอ้อมสำเร็จรูปแต่เมื่อเด็กโตขึ้นจนถึงวัยที่ไม่ต้องใช้ผ้าอ้อมสำเร็จรูปแล้ว ครอบครัวนี้ก็ไม่ได้เป็นลูกค้าของบริษัทนี้อีกต่อไป อีกรูปแบบหนึ่งคือ Voluntary Churn ซึ่งเป็นการยกเลิกการใช้บริการอาจจะเพราะเกิดความไม่พอใจในบริการที่ได้รับ…

Continue Reading →

สไลด์และ vdo เรื่อง Machine Learning for Non-Coders (Anyone)

สไลด์การบรรยายเรื่อง Machine Learning for Non-Codes (Anyone) ในงาน Dev Mountain Tech Festival เมื่อวันที่ 19 มีนาคม 2565 ที่ผ่านมาครับ โดยเนื้อหาในสไลด์จะอธิบายแนวทางการวิเคราะห์ข้อมูลตั้งแต่พื้นฐานจนถึงรายละเอียดของเทคนิค Machine Learning ครับ…

Continue Reading →

แนะนำการใช้งาน Teachable Machine เบื้องต้น

Teachable Machine (https://teachablemachine.withgoogle.com/) เป็นระบบ No-Code Machine Learning Platform ที่ช่วยให้สามารถทำ Deep Learning ง่ายแบบไม่ต้องเขียน code เลยครับ จากที่เมื่อวานได้อธิบาย No-Code/Low-Code ML Platform ไปเบื้องต้นแล้ว วันนี้ขอแนะนำระบบ…

Continue Reading →

เปรียบเทียบ No-Code/Low-Code Machine Learning Platforms

ในปัจจุบันมีซอฟต์แวร์ที่ใช้ในการวิเคราะห์ข้อมูลแบบ Machine Learning แบบที่ไม่ต้องเขียน code (No-Code) หรือเขียน code เพียงเล็กน้อย (Low-Code) อยู่หลากหลายซอฟต์แวร์เลยครับ ในรูปด้านล่างเป็นการเปรียบเทียบซอฟต์แวร์ต่างๆ เหล่านี้ในเรื่องของความง่ายในการใช้งานและความครอบคลุมในการวิเคราะห์ข้อมูล ในการวิเคราะห์ข้อมูลทาง Machine Learning อาจจะมองว่าเป็นเรื่องยากทั้งเรื่องการคำนวณและการเขียนโปรแกรม (coding) ทำให้ business…

Continue Reading →

ดาวน์โหลดฟรี!! เอกสารการทำ Data Preparation & Feature Engineering ด้วย RapidMiner Studio

หลังจากทำการวิเคราะห์ข้อมูลด้วยเทคนิค Machine Learning มาสักพักก็พบว่าข้อมูลส่วนใหญ่นั้นไม่สามารถนำไปสร้างโมเดลได้ทันทีแต่จำเป็นต้องมีการสร้างตัวแปรใหม่ (derived variable) หรือทำการเตรียมข้อมูลให้อยู่ในรูปแบบตารางที่เรียกว่า Analytical Base Table (ABT) ซึ่งประกอบด้วย แถวที่แสดงตัวอย่างของข้อมูล (unit of analysis) คอลัมน์ซึ่งแสดงตัวแปร(feature/attribute) ในเอกสารนี้ได้สรุปแนวทางทางในการทำ Data Preparation…

Continue Reading →

อ่านฟรี หนังสือ Introduction to Data Mining Techniques (ภาษาไทย)

เนื่องในโอกาสก้าวเข้าสู่ปีที่ 10 ของดาต้า คิวบ์ ทางเราจึงเปิดให้อ่านหนังสือ Introduction to Data Mining Techniques (ภาษาไทย) ได้ฟรีผ่านทางระบบ Google Drive ท่านใดสนใจสามารถเพิ่มรายละเอียดในฟอร์มด้านล่างได้เลยครับ ทางเราจะเพิ่มสิทธิ์ในการอ่านหนังสือภายใน 24 ชั่วโมงหลังจากได้รับข้อมูลครับ <span data-mce-type=”bookmark”…

Continue Reading →

ดาวน์โหลดฟรีเอกสารพื้นฐานสถิติสำหรับวิเคราะห์ข้อมูลทาง Machine Learning

เอกสารด้านล่างเป็นส่วนหนึ่งเอกสารที่ใช้ในการอบรมหลักสูตร Practical Data Science and Machine Learning with RapidMiner TurboPrep and AutoModel ซึ่งมีระยะเวลาการอบรม 3 วัน โดยในเอกสารนี้จะประกอบด้วยหัวข้อต่างๆ ได้แก่ พื้นฐานทางสถิติ Descriptive Statistics…

Continue Reading →

ดาวน์โหลดฟรีเอกสารการใช้งาน RapidMiner TurboPrep เบื้องต้น

เอกสารด้านล่างเป็นส่วนหนึ่งเอกสารที่ใช้ในการอบรมหลักสูตร Practical Data Science and Machine Learning with RapidMiner TurboPrep and AutoModel ซึ่งมีระยะเวลาการอบรม 3 วันตั้งแต่วันที่ 25-27 กรกฎาคม 2565 ครับ โดยในเอกสารนี้จะประกอบด้วยหัวข้อต่างๆ…

Continue Reading →

การใช้ RapidMiner ดึงข้อมูลจากฐานข้อมูล SQLServer

เอกสารขั้นตอนการใช้ RapidMiner ดึงข้อมูลจากฐานข้อมูล SQLServer ดาวน์โหลดได้จากที่นี่ครับ หมายเหตุ เอกสารนี้เป็นส่วนหนึ่งของเอกสารประกอบการอบรมหลักสูตร Introduction to Customer Segmentation with RapidMiner Studio 9 หาซื้อได้จาก https://datacubeth.ai/big-data-machine-learning-rapidminer-book

Continue Reading →