Review หนังสือเรื่อง Data Driven Company
ผมบังเอิญเจอหนังสือเล่มนี้ครับ ซึ่งชื่อเรื่องคล้ายๆ กับที่ผมจะไปบรรยายให้กับ UPM Academy ในเรื่อง data driven organization พอดิบพอดี (ซึ่งผู้เข้าร่วมจะเป็นผู้ที่เกี่ยวข้องกับบริษัท อสังหาริมทรัพย์ต่างๆ ครับ)
ดาวน์โหลดฟรี!! เอกสารการทำ Data Preparation & Feature Engineering ด้วย RapidMiner Studio
หลังจากทำการวิเคราะห์ข้อมูลด้วยเทคนิค Machine Learning มาสักพักก็พบว่าข้อมูลส่วนใหญ่นั้นไม่สามารถนำไปสร้างโมเดลได้ทันทีแต่จำเป็นต้องมีการสร้างตัวแปรใหม่ (derived variable) หรือทำการเตรียมข้อมูลให้อยู่ในรูปแบบตารางที่เรียกว่า Analytical Base Table (ABT) ซึ่งประกอบด้วย
- แถวที่แสดงตัวอย่างของข้อมูล (unit of analysis)
- คอลัมน์ซึ่งแสดงตัวแปร(feature/attribute)
ในเอกสารนี้ได้สรุปแนวทางทางในการทำ Data Preparation และ Feature Engineering ที่ใช้งานบ่อยไว้ให้ครับ โดยมีหัวข้อต่างๆ ได้แก่
- Select Attributes ใช้สำหรับเลือกคอลัมน์หรือแอตทริบิวต์ที่ต้องการใช้งาน
- Filter Examples ใช้สำหรับเลือกแถว (example) ที่ต้องการใช้งาน
- Replace / Map ใช้สำหรับการแทนที่ค่าในชุดข้อมูล
- Set Role ใช้สำหรับกำหนดหน้าที่ (role) ให้แต่ละตัวแปร
- Trim ใช้สำหรับลบช่องว่างที่อยู่ด้านหน้าและด้านหลังของข้อมูล
- Convert Data Type ใช้สำหรับแปลงประเภทของข้อมูลต่างๆ
- Replace Missing Value ใช้สำหรับแทนที่ค่าว่างในชุดข้อมูล
- Generate Attributes ใช้สำหรับสร้างคอลัมน์หรือแอตทริบิวต์ใหม่
- Aggregate ใช้สำหรับ group ค่าให้อยู่ในรูปแบบที่ต้องการ
- Pivot ใช้สำหรับสร้างตาราง Pivot
- Join ใช้สำหรับสร้างเชื่อมโยงข้อมูล 2 ตาราง
- Append ใช้สำหรับเพิ่มข้อมูลเข้าไปในตารางเดิม
- Set Minus ใช้สำหรับลบข้อมูลที่ไม่ต้องการออก
ท่านใดสนใจดาวน์โหลดเอกสารได้จาก link นี้หรือคลิกที่รูปภาพได้เลยครับ ^^
ทางเราได้มีการจัดอบรมเชิงปฏิบัติการในการนำเทคนิคเหล่านี้มาทำการวิเคราะห์ข้อมูลต่างๆ เช่น
- การแบ่งกลุ่มลูกค้าตามการชำระเงิน
- การสร้างแบบจำลองเพื่อคาดการณ์โอกาสซื้อสินค้า (propensity to buy)
- การวิเคราะห์ข้อความ (text mining)
- การวิเคราะห์ข้อมูล log (log analysis)
รายละเอียดเพิ่มเติมดูได้จาก https://datacubeth.ai/data-science-training/data-preparation-and-feature-engineering-for-data-analytics-and-machine-learning-workshop-with-rapidminer-studio-ai-hub/
สไลด์บรรยายในงาน MarTech Expo 2023
เมื่อวันก่อนได้รับโอกาสให้ไปบรรยายใน workshop เรื่อง Machine Learning for Business (workshop with MarTech App) ครับ เลยอยากขอนำสไลด์มาแชร์ให้ผู้สนใจได้ดูกันครับ (คลิกที่รูปได้เลยนะครับ)
![](https://demo.datacubeth.ai/wp-content/uploads/2023/09/Screen-Shot-2566-03-02-at-12.23.55-PM-1024x574-1.png)
ส่วนข้อมูลสามารถดาวน์โหลดได้จาก datacubeth.ai/p2b_data.xlsx
ดาวน์โหลดฟรีเอกสารการใช้งาน RapidMiner TurboPrep เบื้องต้น
เอกสารด้านล่างเป็นส่วนหนึ่งเอกสารที่ใช้ในการอบรมหลักสูตร Practical Data Science and Machine Learning with RapidMiner TurboPrep and AutoModel ซึ่งมีระยะเวลาการอบรม 3 วันตั้งแต่วันที่ 25-27 กรกฎาคม 2565 ครับ โดยในเอกสารนี้จะประกอบด้วยหัวข้อต่างๆ ได้แก่
- การดูรายละเอียดของข้อมูล (show detail)
- การเรียงลำดับข้อมูล (sort)
- การแทนค่าข้อมูล (replace)
- การแทนค่าว่าง (replace missing value)
- การเลือกข้อมูลบางตัวอย่าง (filter examples)
- การ join ข้อมูล 2 ชุดเข้าด้วยกัน
- การ Export Data และ Process
ดาวน์โหลดได้จาก ที่นี่ หรือคลิกที่รูปด้านล่างได้เลยครับ
![](https://demo.datacubeth.ai/wp-content/uploads/2023/09/Screen-Shot-2564-08-07-at-6.14.17-PM-1024x830-1.png)