*** เป็นการอบรมแบบ online ผ่านระบบ ZOOM และสามารถดู record ย้อนหลังเพื่อทบทวนได้ตลอดครับ ***
ภาพรวมของหลักสูตร
ในการวิเคราะห์ข้อมูลหรือสร้างแบบจำลองด้วยเทคนิคการเรียนรู้ของเครื่อง (Machine Learning) จำเป็นจะต้องเตรียมข้อมูลที่อยู่ในรูปแบบของตารางที่เรียกว่า Analytical Base Table (ABT) ซึ่งประกอบด้วยแถวที่แสดงตัวอย่างของข้อมูล(unit of analysis) และคอลัมน์ซึ่งแสดงตัวแปร(feature/attribute) ที่ใช้ในการวิเคราะห์ ซึ่งโดยปกติแล้วตาราง ABT นี้จะเกิดจากการเชื่อมโยงข้อมูลหลายตารางและการคัดเลือกหรือสร้างตัวแปรใหม่ๆ ที่มีความน่าสนใจมาใช้ ซึ่งส่วนนี้ใช้เวลาค่อนข้างนานในโครงการวิเคราะห์ข้อมูลด้วยเทคนิคการเรียนรู้ของเครื่อง นอกจากนี้การจัดการข้อมูลที่มีรูปแบบพิเศษ เช่น ข้อมูลที่เป็นอนุกรมเวลา (Time Series) และข้อมูลประเภทที่ไม่มีโครงสร้าง เช่น ข้อความ (text) หรือ log data ก็ได้รับความสนใจเพิ่มมากขึ้นเรื่อยๆ ดังนั้นในการอบรมหลักสูตรนี้จึงแบ่งเนื้อหาออกเป็น 4 ส่วนใหญ่ๆ ได้แก่
- concept ของการจัดการข้อมูล (data preparation) และ การสร้างคุณลักษณะใหม่ๆ (feature engineering)
- การจัดการและเตรียมข้อมูลที่มีโครงสร้าง (structured data)
- การแบ่งกลุ่มข้อมูลลูกค้า (Customer Segmentation) ตามพฤติกรรมการชำระเงิน
- การคาดการณ์ว่าลูกค้าคนใดบ้างจะซื้อสินค้าในอนาคต (Propensity to Buy)
- การจัดการและเตรียมข้อมูลที่ไม่มีโครงสร้าง (unstructured data)
- การแปลงข้อมูล web access log เพื่อการแสดงผล
- การวิเคราะห์ข้อมูลจาก Twitter
- การจัดการและเตรียมข้อมูลอนุกรมเวลา (time series)
- การวิเคราะห์ข้อมูลสภาพอากาศ
หัวข้อการอบรม
วันที่ 1
- ทบทวนกระบวนการมาตรฐานในการวิเคราะห์ข้อมูลด้วย CRISP-DM
- สร้าง repository สำหรับการจัดการข้อมูลในเครื่อง (local) และใน AI Hub (server)
- การใช้งาน AI Hub เบื้องต้น เช่น
- การ submit process เพื่อไปรันบน AI Hub
- การตั้ง schedule เพื่อให้ทำงานอัตโนมัติ
- การเตรียมข้อมูลขั้นพื้นฐานด้วย RapidMiner Studio ได้แก่
- การเลือกแอตทริบิวต์ในตาราง (Select Attributes)
- การเลือกเฉพาะข้อมูลที่ต้องการ (Filter Examples)
- การแทนค่าในข้อมูล (Map)
- การลบค่าว่างที่เกิดขึ้นในข้อความ (Trim)
- การแทนที่ค่าว่างในข้อมูล (Replace Missing Values)
- การสร้างแอตทริบิวต์ใหม่ (Generate Attributes)
- การเชื่อมโยงข้อมูล 2 ตาราง (Join)
- การรวมค่า (Aggregate)
- การสร้างตาราง Pivot
- การเตรียมข้อมูลขั้นสูงด้วยRapidMiner Studio ได้แก่
- การวนลูปต่างๆ (Loop Example, Loop Values, Loop Files)
- การจัดการกับ Macro
- การเลือกเงื่อนไขเพื่อให้ทำงาน (Select Subprocess, Branch)
วันที่ 2
- Workshop การจัดการและเตรียมข้อมูลที่มีโครงสร้าง (Structured Data)
- การเตรียมข้อมูลตามพฤติกรรมการชำระเงินของลูกค้าแต่ละรายเพื่อทำการจัดกลุ่ม (Customer Segmentation)
- การแบ่งกลุ่มข้อมูลเพื่อหาพฤติกรรมการชำระเงินของลูกค้าแต่ละราย
- สร้างตัวแปรใหม่ทางธุรกิจ เช่น
- จำนวนครั้งในการชำระเงิน ตรงเวลา ล่าช้า หรือ ก่อนเวลา
- จำนวนวันที่ชำระเงิน ล่าช้า หรือ ก่อนเวลา
- เตรียมข้อมูลเพื่อทำ clustering
- การเตรียมข้อมูล (ตาราง ABT) สำหรับสร้างแบบจำลองเพื่อทำ Response Modeling (Propensity to Buy)
- การกำหนดค่า window ต่างๆ เช่น action window และ observation window
- การสร้างตัวแปรใหม่ทางธุรกิจ เช่น ความถี่ (frequency) ปริมาณที่ซื้อ (quantity)
- การเตรียมข้อมูลตามพฤติกรรมการชำระเงินของลูกค้าแต่ละรายเพื่อทำการจัดกลุ่ม (Customer Segmentation)
- การจัดการข้อความ (Text Preprocessing) เช่น
- การตัดคำ (tokenization)
- การทำ Stemming
- การหา POS (Part Of Speech) ต่างๆ
- Workshop การจัดการและเตรียมข้อมูลที่ไม่มีโครงสร้าง(Unstructured Data)
- การแปลงข้อมูล web access log เพื่อการแสดงผล (data visualization) ในรูปแบบของกราฟต่างๆ เช่น
- แสดงจำนวนผู้เข้าชมเว็บไซต์ในแต่ละช่วงเวลา
- แสดงจำนวน status หลังจากการ request ไปที่ server
- การดึงข้อมูลจาก Twitter และการจัดการกับข้อความที่ได้
- ดึงข้อมูลจาก Twitter แบบง่ายๆ โดยที่ไม่ต้องเขียน code
- แปลงข้อความจาก Twitter ให้เป็นตาราง
- การแปลงข้อมูล web access log เพื่อการแสดงผล (data visualization) ในรูปแบบของกราฟต่างๆ เช่น
วันที่ 3
- การทำ Feature Engineering ขั้นพื้นฐาน ได้แก่
- การแบ่งช่วงข้อมูล (Discretization)
- การแปลงการกระจายตัว(distribution) ของข้อมูล
- การหา Outlier ด้วยวิธี IQR (Inter Quartile Range)
- การปรับช่วงของข้อมูล (Normalization)
- การจัดการกับข้อมูลอนุกรมเวลา(Time Series)
- Workshop การจัดการข้อมูลอนุกรมเวลาด้วย RapidMiner Studio
- การจัดการข้อมูลจากSensor ต่างๆ
- การจัดการข้อมูลสภาพอากาศต่างๆ
วิทยากร
ดร.เอกสิทธิ์ พัชรวงศ์ศักดา
(ผู้ร่วมก่อตั้งและ หัวหน้าทีม Data Science บริษัท คิวบ์ อนาไลติกส์ คอนซัลติ้ง)
ประสบการณ์
- ผู้แต่งหนังสือเรื่อง A Little Book of Big Data and Machine Learning
- เป็น RapidMiner Ambassador ของประเทศไทยตั้งแต่ปี 2016
- ที่ปรึกษาทางด้าน Data Analytics บริษัทอสังหาริมทรัพย์
- ที่ปรึกษาทางด้าน Data Science บริษัทน้ำมัน
- พัฒนาโครงการทางด้าน Data Scienceให้กับบริษัทค้าปลีก (retail) และขายสินค้าผ่านทางโทรศัพท์ (Tele-marketing)
- พัฒนาโครงการทางด้าน Data Science ให้กับบริษัทจัดการสินเชื่อ
- พัฒนาโครงการทางด้าน Machine Learning ให้กับบริษัทผลิตสินค้า
- พัฒนาโครงการทางด้าน Machine Learningให้กับหน่วยงานภาครัฐต่างๆ
- วิทยากรอบรมการใช้วิเคราะห์ข้อมูลด้วยเทคนิค Data Science และ Machine Learning ด้วย RapidMiner ให้กับสถาบันการเงินต่างๆ
- วิทยากรอบรมการใช้วิเคราะห์ข้อมูลด้วยเทคนิค Data Science และ Machine Learning ด้วย RapidMiner ให้กับภาคอุตสาหกรรมการผลิต (Manufacturer)
- วิทยากรอบรมการใช้วิเคราะห์ข้อมูลด้วยเทคนิค Data Science และ Machine Learning ด้วย RapidMiner ให้กับหน่วยงานภาครัฐและมหาวิทยาลัยต่างๆ
- มีใบ certificate ที่เกี่ยวข้องกับ RapidMiner ทุกใบ (7 ใบ)





วันและเวลาการอบรม
วันพุธที่ 25 พฤษภาคม 2565 ถึง วันศุกร์ที่ 27 พฤษภาคม 2565 (ระยะเวลาการอบรม 3 วัน)
เวลา: 09:30-17:00 น.
ค่าลงทะเบียน
- ราคา: 8,500 บาท/ท่าน
- (ราคารวม vat 7% แล้ว แต่ทางหน่วยงานสามารถหักภาษี ณ ที่จ่าย 3% ได้ครับ)
- สามารถออกใบกำกับภาษีในนามหน่วยงานหรือบุคคลได้ครับ (ออกโดยบริษัท คิวบ์ คิวบ์ เอ็ดยู-ซีน จำกัด)
- ผู้เข้าร่วมอบรมจะได้รับเอกสารประกอบการอบรมในรูปแบบ PDF และ สามารถดู record ย้อนหลังได้ตลอดเวลา
- ชำระเงินโดยการโอนเงินมายังบัญชีต่อไปนี้
- บริษัท คิวบ์ เอ็ดยู-ซีน จำกัด ธนาคารไทยพาณิชย์ สาขาเดอะคริสตัล ราชพฤกษ์ หมายเลขบัญชี 416-123639-4
จัดการอบรมโดย บริษัท คิวบ์ เอ็ดยู-ซีน จำกัด (Cube Edu-sine)
ติดต่อได้ที่:
- Facebook: http://facebook.com/datacube.th
- Email: chutimon@datacubeth.ai หรือ eakasit@datacubeth.ai
- Mobile: 0894963840
- Line ID: eakasitp
ขณะนี้มีผู้สนใจสำรองที่นั่งรุ่นที่ 3 แล้วจำนวน 8 ท่าน (รับไม่เกิน 20 ท่าน)
- คุณ ปรีชา
- คุณ Natthapon
- คุณ Rattanawadee
- คุณ ศิรวิทย์
- คุณ ดนัย
- คุณ จุไรรัตน์
- คุณ บัลลังก์
- คุณ Ramita