อ่านฟรี หนังสือ Introduction to Data Mining Techniques (ภาษาไทย)

เนื่องในโอกาสวันครูแห่งชาติปี 2022 ทางดาต้า คิวบ์ เปิดให้อ่านหนังสือ Introduction to Data Mining Techniques (ภาษาไทย) ได้ฟรีผ่านทางระบบ Google Drive ท่านใดสนใจสามารถเพิ่มรายละเอียดในฟอร์มด้านล่างได้เลยครับ ทางเราจะเพิ่มสิทธิ์ในการอ่านหนังสือภายใน 24 ชั่วโมงหลังจากได้รับข้อมูลครับ <span data-mce-type=”bookmark” style=”display: inline-block; width: 0px; overflow: hidden; line-height: 0;” class=”mce_SELRES_start”></span>

ดาวน์โหลดฟรีเอกสารพื้นฐานสถิติสำหรับวิเคราะห์ข้อมูลทาง Machine Learning

เอกสารด้านล่างเป็นส่วนหนึ่งเอกสารที่ใช้ในการอบรมหลักสูตร Practical Data Science and Machine Learning with RapidMiner TurboPrep and AutoModel ซึ่งมีระยะเวลาการอบรม 3 วัน โดยในเอกสารนี้จะประกอบด้วยหัวข้อต่างๆ ได้แก่ พื้นฐานทางสถิติ Descriptive Statistics ค่าเฉลี่ย (Mean) ค่ามัธยฐาน (Median) ค่าฐานนิยม (Mode) ค่าเบี่ยงเบนมาตรฐาน (Standard Deviation) Rank-ordered Statistics การหา Outlier ด้วยวิธี IQR (Inter Quartile Range) การหาค่า Correlation

ดาวน์โหลดฟรีเอกสารการใช้งาน RapidMiner TurboPrep เบื้องต้น

เอกสารด้านล่างเป็นส่วนหนึ่งเอกสารที่ใช้ในการอบรมหลักสูตร Practical Data Science and Machine Learning with RapidMiner TurboPrep and AutoModel ซึ่งมีระยะเวลาการอบรม 3 วันตั้งแต่วันที่ 18 – 20 สิงหาคม 2564 ครับ โดยในเอกสารนี้จะประกอบด้วยหัวข้อต่างๆ ได้แก่ การดูรายละเอียดของข้อมูล (show detail) การเรียงลำดับข้อมูล (sort) การแทนค่าข้อมูล (replace) การแทนค่าว่าง (replace missing value) การเลือกข้อมูลบางตัวอย่าง (filter examples) การ join ข้อมูล

เอกสารประกอบการบรรยายเรื่อง เทคนิคการใช้ Big Data ต่อยอดธุรกิจ

เมื่อวันที่ 2 กรกฏาคม 2021 ทางดาต้า คิวบ์ได้ไปร่วม live กับ Page Ocean Sky Network ผู้พัฒนาระบบ Social Analytics ที่ชื่อว่า Mandala (ซึ่งสามารถดาวน์โหลดมาทดลองได้ฟรีครับ) ในหัวข้อ เทคนิคการใช้ Big Data ต่อยอดธุรกิจ โดยมีเนื้อหาแบ่งเป็น 3 ส่วน คือ แนะนำให้รู้จักกับ Big Data ว่าคืออะไร แนะนำให้รู้จักการวิเคราะห์ข้อมูล (Data Analytics) ต่างๆ เช่น การวิเคราะห์เชิงพรรณนา (Descriptive Analytics) การวิเคราะห์เชิงวินิจฉัย

สไลด์แนะนำการใช้งานภาษา R เบื้องต้นในการสร้างกราฟและสร้างแบบจำลอง

ดาวน์โหลดสไลด์แนะนำการใช้งานภาษา R ซึ่งมีหัวข้อต่างๆ ดังนี้ แนะนํา R และ RStudio โครงสร้างข้อมูลพื้นฐานใน R การอ่านไฟล์ข้อมูล การเขียนโปรแกรมภาษา R เบื้องต้น การเลือกเงื่อนไข (IF) การวนรอบ (loop) การเขียนฟังก์ชัน การสร้างกราฟด้วย R เบื้องต้น การสร้างโมเดล classification ด้วย R เบื้องต้น ท่านใดสนใจดาวน์โหลดได้จาก link นี้หรีอ click ที่รูปได้เลยครับ

การใช้ RapidMiner ดึงข้อมูลจากฐานข้อมูล SQLServer

เอกสารขั้นตอนการใช้ RapidMiner ดึงข้อมูลจากฐานข้อมูล SQLServer ดาวน์โหลดได้จากที่นี่ครับ หมายเหตุ เอกสารนี้เป็นส่วนหนึ่งของเอกสารประกอบการอบรมหลักสูตร Introduction to Customer Segmentation with RapidMiner Studio 9 หาซื้อได้จาก https://datacubeth.ai/big-data-machine-learning-rapidminer-book

ชุดข้อมูลสำหรับทำ workshop จากหนังสือ Box Set: Big Data Machine Learning

ท่านที่ซื้อหนังสือแบบ Box Set ไปแล้วจะมี 2 เล่มที่เป็น workshop คือ Introduction to Predictive Modeling with RapidMiner Studio 9 จะมีตัวอย่างของการทำ propensity to buy หรือ การหาว่าลูกค้าแบบไหนจะซื้อสินค้าที่จะนำเสนอบ้าง สามารถดาวน์โหลดข้อมูลได้ที่นี่ ครับ Introduction to Customer Segmentation with RapidMiner Platform จะมีตัวอย่างการแบ่งกลุ่มลูกค้า โดยทำการถึงข้อมูลจาก Databases Server ซึ่งมีรายละเอียดดังนี้ database server: SQL Server

Summary Note บทที่ 2 จากหลักสูตร Practical Data Mining with RapidMiner Studio 9

หลักสูตร Practical Data Mining with RapidMiner Studio 9 นี้เป็นหลักสูตรที่เน้นอธิบาย 2 ส่วนคือ concept ของการวิเคราะห์ข้อมูลและการใช้งานซอฟต์แวร์ RapidMiner Studio 9 ครับ ในโพสต์นี้จะเป็นสรุปในบทที่ 2 ของหลักสูตรนี้ซึ่งเนื้อหาจะเกี่ยวกับ CRISP-DM ครับ ดาวน์โหลดไฟล์ PDF ได้ที่นี่

Summary Note บทที่ 1 จากหลักสูตร Practical Data Mining with RapidMiner Studio 9

หลักสูตร Practical Data Mining with RapidMiner Studio 9 นี้เป็นหลักสูตรที่เน้นอธิบาย 2 ส่วนคือ concept ของการวิเคราะห์ข้อมูลและการใช้งานซอฟต์แวร์ RapidMiner Studio 9 ครับ ในโพสต์นี้จะเป็นสรุปในบทที่ 1 ของหลักสูตรนี้ซึ่งเนื้อหาจะเกี่ยวกับ Introduction to Data Mining ครับ ดาวน์โหลดไฟล์ PDF ได้ที่นี่

ขั้นตอนการสร้างโมเดล Decision Tree

เทคนิค Decision Tree เป็นเทคนิคหนึ่งที่ได้รับความนิยมในการนำมาประยุกต์ใชัในงานด้าน data mining วันนี้ผมจะแนะนำการสร้างโมเดล decision tree แบบง่ายๆ ก่อนอื่นเราจะใช้ข้อมูลในตารางที่ 1 ซึ่งเป็นข้อมูลที่เก็บสภาพภูมิอากาศ 14 วันย้อนหลังเพื่อดูว่าจะมีการจัดแข่งขันกีฬาหรือไม่ ตารางที่ 1 แสดงข้อมูล weather จากข้อมูลในตารางที่ 1 ประกอบด้วย 5 แอตทริบิวต์ คือ outlook แสดงสภาพภูมิอากาศ ประกอบด้วย 3 ค่า คือ sunny, overcast, rainny temperature แสดงอุณหภูมิ ประกอบด้วย 3 ค่า คือ hot, mild,