ในการสร้างโมเดล Classification นั้นมีหลายเทคนิคครับ บางเทคนิคก็แปลความ (Explainability) ได้ง่าย บางเทคนิคก็แปลความยากแต่ความถูกต้อง (Accuracy) สูงครับ ภาพด้านล่างเป็นการแสดงให้เห็นว่าเทคนิคต่างๆ นั้นสามารถอธิบายได้ง่ายหรือยากและมีความถูกต้องมากน้อยแค่ไหนครับ 


โดยเทคนิคต่างๆ มีดังนี้ครับ

1. Linear Regression
เป็นการสร้างสมการเส้นตรง (เช่น y = mx+c) มาสร้างโมเดลเพื่อพยากรณ์ค่าตัวเลขต่างๆ ข้อดีของการเทคนิคนี้คือโมเดลที่ได้แปลความได้ง่ายเพราะแสดงในรูปของสมการทางคณิตศาสตร์ที่เราสามารถแทนค่าเข้าไปได้เลย

2. Logistic Regression
เป็นการสร้างสมการคณิตศาสตร์เพื่อแบ่งแยก (classify) ข้อมูลออกเป็น 2 กลุ่มคำตอบครับ เทคนิคนี้เป็นอีกเทคนิคที่นิยมให้เนื่องจากแปลความโมเดลได้ง่ายครับ และแสดงให้เห็นถึงความสำคัญของตัวแปร (หรือ Feature) ได้ด้วยครับ

3. k-Nearest Neighbours (k-NN)
เป็นการสร้างโมเดลโดยมีแนวคิดว่าข้อมูลที่มีลักษณะคล้ายกันน่าจะอยู่ในกลุ่ม (หรือคลาสเดียวกัน) ครับ

4. Decision Tree
เป็นเทคนิตที่สร้างโมเดลแยกข้อมูลลงมาเป็นลำดับชั้นต่างๆ จนถึงชั้นล่างสุดถึงเป็นคลาสคำตอบ ดูรายละเอียดการสร้างโมเดล Decision Tree ได้จาก http://dataminingtrend.com/2014/decision-tree-model/

5. Naive Bayes
เป็นเทคนิคที่สร้างโมเดลโดยการคำนวณค่าความน่าจะเป็น (probability) ต่างๆ ในข้อมูล ดูรายละเอียดการสร้างโมเดล Naive Bayes ได้จาก http://dataminingtrend.com/2014/naive-bayes/

6. Random Forest
เป็นเทคนิคที่สร้างโมเดล Decision Tree ขึ้นมาหลายๆ ต้นจากการสุ่ม (random) ข้อมูล ซึ่งเป็นเทคนิคหนึ่งของการสร้างโมเดลแบบ Ensemble ครับ ดูรายละเอียดการสร้างโมเดล Ensemble ได้จาก http://dataminingtrend.com/2014/data-mining-techniques/ensemble-model/

7. Support Vector Machines (SVM)
เป็นโมเดลทางคณิตศาสตร์ที่ค่อนข้างซับซ้อนแต่แนวคิดคือการปรับข้อมูลไปให้อยู่ในมิติ (Dimension) ที่สูงขึ้นเพื่อทำให้สามารถแบ่งแยกข้อมูลได้ง่ายขึ้น ดูรายละเอียดการสร้างโมเดล SVM ได้จาก http://dataminingtrend.com/2014/support-vector-machine-svm/

8. XGBoost
เป็นเทคนิค Boosting แบบหนึ่งและเป็นเทคนิคในกลุ่ม Ensemble ที่พยายามพัฒนาโมเดลให้มีความถูกต้องมากขึ้น 

9. Neural Network
เป็นเทคนิคที่สร้างโมเดลที่สลับซับซ้อนมากที่สุด (ในภาพนี้) ซึ่งเป็นพื้นฐานของเทคนิค Deep Learning อีกทีครับ โมเดลของ Neural Network จะมีการปรับค่าน้ำหนัก (weight) ของโมเดล ดูรายละเอียดการสร้างโมเดล Neural Network ได้จาก http://dataminingtrend.com/2014/neural-network-weka-meaning-part1/

credit: https://www.linkedin.com/feed/update/urn:li:activity:6665557816406876160/?commentUrn=urn%3Ali%3Acomment%3A%28activity%3A6664877120965218304%2C6665557691970260993%29

#machinelearning #datascience #datacube#classification #neuralnetwork

เปรียบเทียบความถูกต้อง (Accuracy) กับการแปลความ (Explainability) ของโมเดลต่างๆ
Tagged on:         

Leave a Reply

Your email address will not be published. Required fields are marked *