ดาวน์โหลดฟรีเอกสารพื้นฐานสถิติสำหรับวิเคราะห์ข้อมูลทาง Machine Learning

เอกสารด้านล่างเป็นส่วนหนึ่งเอกสารที่ใช้ในการอบรมหลักสูตร Practical Data Science and Machine Learning with RapidMiner TurboPrep and AutoModel ซึ่งมีระยะเวลาการอบรม 3 วันตั้งแต่วันที่ 18 – 20 สิงหาคม 2564 ครับ โดยในเอกสารนี้จะประกอบด้วยหัวข้อต่างๆ ได้แก่ พื้นฐานทางสถิติ Descriptive Statistics ค่าเฉลี่ย (Mean) ค่ามัธยฐาน (Median) ค่าฐานนิยม (Mode) ค่าเบี่ยงเบนมาตรฐาน (Standard Deviation) Rank-ordered Statistics การหา Outlier ด้วยวิธี

ดาวน์โหลดฟรีเอกสารการใช้งาน RapidMiner TurboPrep เบื้องต้น

เอกสารด้านล่างเป็นส่วนหนึ่งเอกสารที่ใช้ในการอบรมหลักสูตร Practical Data Science and Machine Learning with RapidMiner TurboPrep and AutoModel ซึ่งมีระยะเวลาการอบรม 3 วันตั้งแต่วันที่ 18 – 20 สิงหาคม 2564 ครับ โดยในเอกสารนี้จะประกอบด้วยหัวข้อต่างๆ ได้แก่ การดูรายละเอียดของข้อมูล (show detail) การเรียงลำดับข้อมูล (sort) การแทนค่าข้อมูล (replace) การแทนค่าว่าง (replace missing value) การเลือกข้อมูลบางตัวอย่าง (filter examples) การ join ข้อมูล

เอกสารประกอบการบรรยายเรื่อง เทคนิคการใช้ Big Data ต่อยอดธุรกิจ

เมื่อวันที่ 2 กรกฏาคม 2021 ทางดาต้า คิวบ์ได้ไปร่วม live กับ Page Ocean Sky Network ผู้พัฒนาระบบ Social Analytics ที่ชื่อว่า Mandala (ซึ่งสามารถดาวน์โหลดมาทดลองได้ฟรีครับ) ในหัวข้อ เทคนิคการใช้ Big Data ต่อยอดธุรกิจ โดยมีเนื้อหาแบ่งเป็น 3 ส่วน คือ แนะนำให้รู้จักกับ Big Data ว่าคืออะไร แนะนำให้รู้จักการวิเคราะห์ข้อมูล (Data Analytics) ต่างๆ เช่น การวิเคราะห์เชิงพรรณนา (Descriptive Analytics) การวิเคราะห์เชิงวินิจฉัย

สไลด์แนะนำการใช้งานภาษา R เบื้องต้นในการสร้างกราฟและสร้างแบบจำลอง

ดาวน์โหลดสไลด์แนะนำการใช้งานภาษา R ซึ่งมีหัวข้อต่างๆ ดังนี้ แนะนํา R และ RStudio โครงสร้างข้อมูลพื้นฐานใน R การอ่านไฟล์ข้อมูล การเขียนโปรแกรมภาษา R เบื้องต้น การเลือกเงื่อนไข (IF) การวนรอบ (loop) การเขียนฟังก์ชัน การสร้างกราฟด้วย R เบื้องต้น การสร้างโมเดล classification ด้วย R เบื้องต้น ท่านใดสนใจดาวน์โหลดได้จาก link นี้หรีอ click ที่รูปได้เลยครับ

การใช้ RapidMiner ดึงข้อมูลจากฐานข้อมูล SQLServer

เอกสารขั้นตอนการใช้ RapidMiner ดึงข้อมูลจากฐานข้อมูล SQLServer ดาวน์โหลดได้จากที่นี่ครับ หมายเหตุ เอกสารนี้เป็นส่วนหนึ่งของเอกสารประกอบการอบรมหลักสูตร Introduction to Customer Segmentation with RapidMiner Studio 9 หาซื้อได้จาก https://datacubeth.ai/big-data-machine-learning-rapidminer-book

ชุดข้อมูลสำหรับทำ workshop จากหนังสือ Box Set: Big Data Machine Learning

ท่านที่ซื้อหนังสือแบบ Box Set ไปแล้วจะมี 2 เล่มที่เป็น workshop คือ Introduction to Predictive Modeling with RapidMiner Studio 9 จะมีตัวอย่างของการทำ propensity to buy หรือ การหาว่าลูกค้าแบบไหนจะซื้อสินค้าที่จะนำเสนอบ้าง สามารถดาวน์โหลดข้อมูลได้ที่นี่ ครับ Introduction to Customer Segmentation with RapidMiner Platform จะมีตัวอย่างการแบ่งกลุ่มลูกค้า โดยทำการถึงข้อมูลจาก Databases Server ซึ่งมีรายละเอียดดังนี้ database server: SQL Server

Summary Note บทที่ 2 จากหลักสูตร Practical Data Mining with RapidMiner Studio 9

หลักสูตร Practical Data Mining with RapidMiner Studio 9 นี้เป็นหลักสูตรที่เน้นอธิบาย 2 ส่วนคือ concept ของการวิเคราะห์ข้อมูลและการใช้งานซอฟต์แวร์ RapidMiner Studio 9 ครับ ในโพสต์นี้จะเป็นสรุปในบทที่ 2 ของหลักสูตรนี้ซึ่งเนื้อหาจะเกี่ยวกับ CRISP-DM ครับ ดาวน์โหลดไฟล์ PDF ได้ที่นี่

Summary Note บทที่ 1 จากหลักสูตร Practical Data Mining with RapidMiner Studio 9

หลักสูตร Practical Data Mining with RapidMiner Studio 9 นี้เป็นหลักสูตรที่เน้นอธิบาย 2 ส่วนคือ concept ของการวิเคราะห์ข้อมูลและการใช้งานซอฟต์แวร์ RapidMiner Studio 9 ครับ ในโพสต์นี้จะเป็นสรุปในบทที่ 1 ของหลักสูตรนี้ซึ่งเนื้อหาจะเกี่ยวกับ Introduction to Data Mining ครับ ดาวน์โหลดไฟล์ PDF ได้ที่นี่

ขั้นตอนการสร้างโมเดล Decision Tree

เทคนิค Decision Tree เป็นเทคนิคหนึ่งที่ได้รับความนิยมในการนำมาประยุกต์ใชัในงานด้าน data mining วันนี้ผมจะแนะนำการสร้างโมเดล decision tree แบบง่ายๆ ก่อนอื่นเราจะใช้ข้อมูลในตารางที่ 1 ซึ่งเป็นข้อมูลที่เก็บสภาพภูมิอากาศ 14 วันย้อนหลังเพื่อดูว่าจะมีการจัดแข่งขันกีฬาหรือไม่ ตารางที่ 1 แสดงข้อมูล weather จากข้อมูลในตารางที่ 1 ประกอบด้วย 5 แอตทริบิวต์ คือ outlook แสดงสภาพภูมิอากาศ ประกอบด้วย 3 ค่า คือ sunny, overcast, rainny temperature แสดงอุณหภูมิ ประกอบด้วย 3 ค่า คือ hot, mild,

ระดับของการวิเคราะห์ข้อมูล (Data Analytics)

ในการทำ Data Analytics หรือ Data Driven Markeing เป็นการนำข้อมูลมาช่วยในการตัดสินใจเพื่อให้มีความแม่นยำและถูกต้องมากขึ้น รูปนี้เป็นรูปที่ผมมักจะใช้ในการอธิบายเรื่องระดับของการวิเคราะห์ข้อมูล (Data Analytics) โดยในรูปจะเริ่มตั้งแต่ข้อมูล (Data) ไปจนถึงการตัดสินใจ (Decision) หรือการกระทำ (Action) โดยในรูปจะแสดงระดับในการวิเคราะห์ข้อมูลต่างๆ ซึ่งมีรายละเอียดดังนี้ การวิเคราะห์ข้อมูลแบบ Descriptive Analytics จะเป็นการนำข้อมูลมาอธิบายว่ามีอะไรเกิดขึ้นมาแล้วบ้าง เช่น ยอดขายในเดือนที่ผ่านมาของแต่ละสาขา การวิเคราะห์ลักษณะนี้ช่วยในการตัดสินใจได้ค่อนข้างน้อยจึงจำเป็นต้องมีผู้เชี่ยวชาญ (หรือผู้บริหาร) เข้ามาเกี่ยวข้องในการตัดสินใจดังแสดงในส่วนที่เป็นสีฟ้า (Human Input) ครับ ตัวอย่างเช่น ถ้าเราอยากรู้ว่าสินค้าชนิดนี้จะต้องผลิตเท่าไร การวิเคราะห์แบบนี้จะให้ข้อมูลมาว่าในอดีตเคยขายได้เท่าไร ผู้บริหารจะต้องมาคิดเพื่อตัดสินใจอีกครั้ง การวิเคราะห์ข้อมูลแบบ Diagnostic Analytics เป็นการวิเคราะห์ในหลากหลายมุมมองมากขึ้น เช่น