ดาวน์โหลดฟรีเอกสารการใช้งาน RapidMiner TurboPrep เบื้องต้น

เอกสารด้านล่างเป็นส่วนหนึ่งเอกสารที่ใช้ในการอบรมหลักสูตร Practical Data Science and Machine Learning with RapidMiner TurboPrep and AutoModel ซึ่งมีระยะเวลาการอบรม 3 วันตั้งแต่วันที่ 18 – 20 สิงหาคม 2564 ครับ โดยในเอกสารนี้จะประกอบด้วยหัวข้อต่างๆ ได้แก่ การดูรายละเอียดของข้อมูล (show detail) การเรียงลำดับข้อมูล (sort) การแทนค่าข้อมูล (replace) การแทนค่าว่าง (replace missing value) การเลือกข้อมูลบางตัวอย่าง (filter examples) การ join ข้อมูล

อ่านฟรี หนังสือ Introduction to Data Mining Techniques (ภาษาไทย)

เนื่องในโอกาสวันครูแห่งชาติปี 2022 ทางดาต้า คิวบ์ เปิดให้อ่านหนังสือ Introduction to Data Mining Techniques (ภาษาไทย) ได้ฟรีผ่านทางระบบ Google Drive ท่านใดสนใจสามารถเพิ่มรายละเอียดในฟอร์มด้านล่างได้เลยครับ ทางเราจะเพิ่มสิทธิ์ในการอ่านหนังสือภายใน 24 ชั่วโมงหลังจากได้รับข้อมูลครับ <span data-mce-type=”bookmark” style=”display: inline-block; width: 0px; overflow: hidden; line-height: 0;” class=”mce_SELRES_start”></span>

ดาวน์โหลดฟรีเอกสารพื้นฐานสถิติสำหรับวิเคราะห์ข้อมูลทาง Machine Learning

เอกสารด้านล่างเป็นส่วนหนึ่งเอกสารที่ใช้ในการอบรมหลักสูตร Practical Data Science and Machine Learning with RapidMiner TurboPrep and AutoModel ซึ่งมีระยะเวลาการอบรม 3 วัน โดยในเอกสารนี้จะประกอบด้วยหัวข้อต่างๆ ได้แก่ พื้นฐานทางสถิติ Descriptive Statistics ค่าเฉลี่ย (Mean) ค่ามัธยฐาน (Median) ค่าฐานนิยม (Mode) ค่าเบี่ยงเบนมาตรฐาน (Standard Deviation) Rank-ordered Statistics การหา Outlier ด้วยวิธี IQR (Inter Quartile Range) การหาค่า Correlation

เอกสารประกอบการบรรยายเรื่อง เทคนิคการใช้ Big Data ต่อยอดธุรกิจ

เมื่อวันที่ 2 กรกฏาคม 2021 ทางดาต้า คิวบ์ได้ไปร่วม live กับ Page Ocean Sky Network ผู้พัฒนาระบบ Social Analytics ที่ชื่อว่า Mandala (ซึ่งสามารถดาวน์โหลดมาทดลองได้ฟรีครับ) ในหัวข้อ เทคนิคการใช้ Big Data ต่อยอดธุรกิจ โดยมีเนื้อหาแบ่งเป็น 3 ส่วน คือ แนะนำให้รู้จักกับ Big Data ว่าคืออะไร แนะนำให้รู้จักการวิเคราะห์ข้อมูล (Data Analytics) ต่างๆ เช่น การวิเคราะห์เชิงพรรณนา (Descriptive Analytics) การวิเคราะห์เชิงวินิจฉัย

สไลด์แนะนำการใช้งานภาษา R เบื้องต้นในการสร้างกราฟและสร้างแบบจำลอง

ดาวน์โหลดสไลด์แนะนำการใช้งานภาษา R ซึ่งมีหัวข้อต่างๆ ดังนี้ แนะนํา R และ RStudio โครงสร้างข้อมูลพื้นฐานใน R การอ่านไฟล์ข้อมูล การเขียนโปรแกรมภาษา R เบื้องต้น การเลือกเงื่อนไข (IF) การวนรอบ (loop) การเขียนฟังก์ชัน การสร้างกราฟด้วย R เบื้องต้น การสร้างโมเดล classification ด้วย R เบื้องต้น ท่านใดสนใจดาวน์โหลดได้จาก link นี้หรีอ click ที่รูปได้เลยครับ

การใช้ RapidMiner ดึงข้อมูลจากฐานข้อมูล SQLServer

เอกสารขั้นตอนการใช้ RapidMiner ดึงข้อมูลจากฐานข้อมูล SQLServer ดาวน์โหลดได้จากที่นี่ครับ หมายเหตุ เอกสารนี้เป็นส่วนหนึ่งของเอกสารประกอบการอบรมหลักสูตร Introduction to Customer Segmentation with RapidMiner Studio 9 หาซื้อได้จาก https://datacubeth.ai/big-data-machine-learning-rapidminer-book

ชุดข้อมูลสำหรับทำ workshop จากหนังสือ Box Set: Big Data Machine Learning

ท่านที่ซื้อหนังสือแบบ Box Set ไปแล้วจะมี 2 เล่มที่เป็น workshop คือ Introduction to Predictive Modeling with RapidMiner Studio 9 จะมีตัวอย่างของการทำ propensity to buy หรือ การหาว่าลูกค้าแบบไหนจะซื้อสินค้าที่จะนำเสนอบ้าง สามารถดาวน์โหลดข้อมูลได้ที่นี่ ครับ Introduction to Customer Segmentation with RapidMiner Platform จะมีตัวอย่างการแบ่งกลุ่มลูกค้า โดยทำการถึงข้อมูลจาก Databases Server ซึ่งมีรายละเอียดดังนี้ database server: SQL Server

Summary Note บทที่ 2 จากหลักสูตร Practical Data Mining with RapidMiner Studio 9

หลักสูตร Practical Data Mining with RapidMiner Studio 9 นี้เป็นหลักสูตรที่เน้นอธิบาย 2 ส่วนคือ concept ของการวิเคราะห์ข้อมูลและการใช้งานซอฟต์แวร์ RapidMiner Studio 9 ครับ ในโพสต์นี้จะเป็นสรุปในบทที่ 2 ของหลักสูตรนี้ซึ่งเนื้อหาจะเกี่ยวกับ CRISP-DM ครับ ดาวน์โหลดไฟล์ PDF ได้ที่นี่

Summary Note บทที่ 1 จากหลักสูตร Practical Data Mining with RapidMiner Studio 9

หลักสูตร Practical Data Mining with RapidMiner Studio 9 นี้เป็นหลักสูตรที่เน้นอธิบาย 2 ส่วนคือ concept ของการวิเคราะห์ข้อมูลและการใช้งานซอฟต์แวร์ RapidMiner Studio 9 ครับ ในโพสต์นี้จะเป็นสรุปในบทที่ 1 ของหลักสูตรนี้ซึ่งเนื้อหาจะเกี่ยวกับ Introduction to Data Mining ครับ ดาวน์โหลดไฟล์ PDF ได้ที่นี่

ขั้นตอนการสร้างโมเดล Decision Tree

เทคนิค Decision Tree เป็นเทคนิคหนึ่งที่ได้รับความนิยมในการนำมาประยุกต์ใชัในงานด้าน data mining วันนี้ผมจะแนะนำการสร้างโมเดล decision tree แบบง่ายๆ ก่อนอื่นเราจะใช้ข้อมูลในตารางที่ 1 ซึ่งเป็นข้อมูลที่เก็บสภาพภูมิอากาศ 14 วันย้อนหลังเพื่อดูว่าจะมีการจัดแข่งขันกีฬาหรือไม่ ตารางที่ 1 แสดงข้อมูล weather จากข้อมูลในตารางที่ 1 ประกอบด้วย 5 แอตทริบิวต์ คือ outlook แสดงสภาพภูมิอากาศ ประกอบด้วย 3 ค่า คือ sunny, overcast, rainny temperature แสดงอุณหภูมิ ประกอบด้วย 3 ค่า คือ hot, mild,