6 วิธีการรับมือกับความไม่เพอร์เฟคของเทคโนโลยี AI
AI ถือเป็นหนึ่งเทคโนโลยีที่เข้ามามีบทบาทสำคัญในการทำธุรกิจยุคใหม่เป็นอย่างมาก ด้วยความสามารถอันชาญฉลาดที่ช่วยแก้ปัญหาด้านต่างๆ และยกระดับการทำงานให้เป็นรูปแบบอัตโนมัติมากยิ่งขึ้น จึงทำให้การนำเทคโนโลยี AI มาใช้งานจึงตอบโจทย์ธุรกิจในปัจจุบันที่ต้องการความสะดวก และรวดเร็วในการทำงานมากยิ่งขึ้นเพื่อให้สอดคล้องกับพฤติกรรมของลูกค้ายุคใหม่ที่ต้องการบริการที่เข้าถึงได้ตลอด 24 ชั่วโมง และสามารถให้บริการตนเอง (Self-service) ได้ผ่านทางเว็บไซต์ และแอปพลิเคชันของธุรกิจ
ถึงแม้ว่าระบบ AI จะมีความสามารถอันชาญฉลาดที่ทำให้ทำงานในรูปแบบที่ต้องทำซ้ำไปมาได้อย่างรวดเร็ว และมีความแม่นยำที่ค่อนข้างสูง แต่ AI เองนั้นเปรียบได้กับคนที่ต้องมีการเรียนรู้ หรือเทรน AI จากข้อมูลต่างๆ เพื่อให้ AI เก่งขึ้นเรื่อยๆ ในขณะเดียวกัน AI เองก็ไม่ได้เพอร์เฟคเช่นเดียวกับมนุษย์ เนื่องจาก AI เองนั้นก็ต้องมีการเรียนรู้อย่างต่อเนื่องจากการเทรนข้อมูลใหม่ๆ จึงทำให้โมเดล AI ที่ใช้กันอยู่ในปัจจุบันนั้นถึงแม้ว่าจะมีความก้าวหน้าไปมากเมื่อเทียบกับแต่ก่อน แต่ในแง่ความฉลาดของ AI นั้นไม่สามารถเทียบเท่ากับความฉลาดของเด็กอายุ 4 ขวบได้ ดังนั้นการเรียนรู้ข้อจำกัดของเทคโนโลยี AI ที่มีอยู่ในปัจจุบันนั้นจะทำให้ธุรกิจมีความเข้าใจที่ถูกต้องเกี่ยวการนำ AI ไปใช้งานได้มากยิ่งขึ้น รวมทั้งหาโซลูชันที่จะช่วยรับมือกับความไม่เพอร์เฟคเหล่านี้ได้อย่างมีประสิทธิภาพ ในบทความนี้ AI GEN จะพาทุกท่านมาหาวิธีเตรียมพร้อมรับมือกับความไม่เพอร์เฟคของ AI เพื่อให้การนำ AI ไปใช้กับธุรกิจเกิดประโยชน์สูงสุด
6 วิธีการที่ธุรกิจสามารถใช้รับมือกับความไม่เพอร์เฟคของ AI
1. Data integrity ความสมบูรณ์และถูกต้องของข้อมูล
การทำงานของ AI ประกอบไปด้วยส่วนที่สำคัญ 2 ส่วน ได้แก่ โมเดล และข้อมูล ซึ่งโมเดล AI จะสามารถทำงานได้ดีก็ต่อเมื่อมี Data หรือข้อมูลที่ดีที่สามารถใช้ในการเทรน AI ได้ ทำให้โมเดลเรียนรู้ และทำงานได้ดีต่อไป โดยที่ถ้าเราใส่ข้อมูลที่ไม่มีคุณภาพ โมเดลที่ได้ออกมาก็จะไม่ดี ทำให้ไม่สามารถนำไปใช้ประโยชน์ทางธุรกิจต่อได้ หรือถ้า Data ไม่ดี แต่โมเดลออกมาดี สิ่งที่ได้ออกมาก็ไม่สามารถนำไปใช้ประโยชน์ได้เช่นกัน หรือถ้าโมเดล Architecture ดีมากแต่ Data ไม่ดี โมเดลก็ทำงานได้ไม่ดี เปรียบได้กับคนที่มีความสามารถแต่ถูกสอนมาแบบผิดๆ นั่นเอง ซึ่งจำเป็นที่จะต้องมีทั้งโมเดล และข้อมูลที่ดีถึงจะเป็นประโยชน์ที่สามารถนำไปใช้งานต่อได้
ในปัจจุบันส่วนใหญ่ AI ที่ได้มีการทำวิจัยมาแล้วนั้นมักจะทำงานได้ดี เช่น Image recognition, Image segmentation และ Natural Language understanding เรียกได้ว่า โมเดล Architecture เหล่านี้มีการรีเสิร์ชมาดีแล้ว
แต่สิ่งที่เราต้องการที่สอนโมเดล AI คือข้อมูล หรือ Data ต้องเป็นข้อมูลที่สะอาด ครบถ้วน และมีคำเฉลยที่ถูกต้อง และสามารถตรวจสอบได้ด้วยการเทสในหลากหลายแบบ ส่วนสุดท้ายเป็นเรื่องของการใช้เครื่องมือ เช่น การทำให้รู้ได้ว่ามี Outliner หรือไม่ เพื่อป้องกันการเกิดเรื่อง Garbage-in, garbage-out หรือการใส่ข้อมูลที่ไม่เป็นประโยชน์จะทำให้ได้ข้อมูลที่ไม่มีประโยชน์กลับคืนออกมา
2. การกำหนดระดับ Confidence interval
AI เปรียบได้กับคนที่ไม่ว่าจะเทรนมามากแค่ไหน หรือต่อให้มี Accuracy rate 99% ก็มีโอกาสผิดพลาดได้อีก 1% นี้ได้เช่นกัน หรืออาจกล่าวได้ว่า AI ไม่ได้เพอร์เฟคเหมือนกับคนนั่นเอง แต่สิ่งที่ AI สามารถทำได้ดีกว่าคนคือ AI สามารถทำงานได้ 24 ชั่วโมง ตลอด 7 วันโดยไม่ต้องหยุดพัก
ตามภาพตัวอย่างที่เห็นเป็นการแบ่งแยกระหว่าง Class A และ B โดยที่ภาพแรก (ซ้ายมือสุด) จะเห็นได้ว่าเทรนออกมาแล้วได้โมเดลที่ไม่ดี เนื่องจากมีส่วนที่ A และ B ยังซ้อนทับกันอยู่ ไม่สามารถแยกออกจากกันได้อย่างชัดเจน ส่วนภาพตรงกลางนั้นแบ่งแยกได้ชัดเจนมากยิ่งขึ้น Center ของ A อยู่ที่ 0 ส่วน B อยู่ที่ 0.5 แสดงว่าสามารถแบ่งแยกได้ระดับนึงแล้ว ส่วนที่ยัง Overlap กันนั้นหมายความว่าถ้าบอกว่าเป็น A แต่จริงๆแล้วเป็น B ก็จะเป็นส่วนที่โมเดลผิดพลาดอยู่บ้าง แต่เป็นส่วนน้อย ตัวอย่างเช่น สุนัขบางพันธุ์บางชนิดหน้าตาคล้ายแมว AI สับสนคิดว่าเป็นแมวจึงมีความผิดพลาดเกิดขึ้น เราจึงต้องนำ Confidence interval มาใช้ในการตัดสินด้วยเพื่อป้องกันความผิดพลาดที่อาจจะเกิดขึ้น ส่วนภาพทางด้านขวาสุดนั้นถือเป็นโมเดล AI ที่ดี มี over labeling area น้อยมาก หมายถึงว่า Confidence interval แบ่งแยกความเป็น A หรือ B ค่อนข้างสูง ซึ่งในความเป็นจริงนั้นค่อนข้างยากที่โมเดล AI จะทำได้ดีขนาดนี้
ส่วนใหญ่ในความเป็นจริงโมเดล AI จะทำได้ในระดับภาพตรงกลาง แล้วเราจะมีวิธีทำกับส่วนที่เป็น Over labeling area ได้อย่างไรบ้าง?
- การใช้ Confidence score เช่น ความมั่นใจสูงกว่า 90% อาจจะโอเค ต่ำกว่า 90% อาจจะต้องอาศัยคนเข้าไปตรวจสอบ มีประโยชน์แต่ต้องใช้อย่างระมัดระวัง อย่างไรก็ตาม confidence interval จะกันได้บางส่วน เช่น จุด A ที่จริงๆ เป็น class A แต่อยู่ปลายๆ distribution confidence level อาจจะต่ำทำให้เรากรองออกง่าย แต่บางครั้งโมเดลอาจจะให้ค่า confidence สูง เช่น จุด B ที่จริงๆ แล้วเป็น class B แต่ว่าไปคล้าย A มากถึงกับให้ค่า confidence score ที่สูงก็สามารถเกิดขึ้นได้ แปลว่าการใช้ confidence score ก็สามารถป้องกันได้เพียงส่วนหนึ่งเท่านั้นในการใช้งานจริง
- ให้คนตรวจสอบ โดยสุ่ม Audit หรือตัดจาก Confidence score
แต่ในหลายๆ ครั้ง AI มั่นใจว่าถูกแต่จริงๆ ผิด ถ้าธุรกิจ หรือองค์กรหวังว่าจะให้เกิดขั้นตอนการทำงานแบบอัตโนมัติ หรือระบบ Automation เราต้องวาง mechanism ในการรองรับความผิดพลาด หรือความเสียหายเหล่านี้ได้ เช่น การปล่อยสินเชื่อของสถาบันการเงิน ถ้า AI ตัดสินใจผิด และความเสียหายในระดับนี้ธุรกิจรับได้หรือไม่ แปลว่าเรายอมรับว่า AI สามารถที่จะตัดสินใจผิดได้ ถ้าเสียหายหรือผิดพลาด ก็เป็นสิ่งที่ธุรกิจสามารถยอมรับได้ เป็นต้น
อีกหนึ่งตัวอย่าง เช่น OCR อ่านข้อมูลเอกสาร สำหรับข้อมูลบางประเภทหากมมีการสะกดผิดนิดหน่อยอาจจะไม่เป็นไร แต่ถ้าเป็นเลขประจำตัวบัตรประชาชนแล้วมีการอ่านค่าเลขผิดอาจเสียหายได้ ต้องดูว่าธุรกิจสามารถยอมรับความผิดพลาดได้ขนาดไหน แล้วทำการออกแบบระบบเพื่อให้ User สามารถตรวจเช็คได้ก่อนแล้วจึงถึงส่งข้อมูลเข้าไปในระบบ หรือกลับเข้ามาแก้ไขข้อมูลในภายหลังได้
3. เก็บข้อมูลเพิ่มเติมเพื่อลด Bias
ในเรื่องของจุดอ่อนในเรื่องของ Bias หรืออคตินั้น บางโมเดลอาจสามารถทำงานได้ดีในบางคลาสขึ้นอยู่กับว่ามีการเทรน Dataset มาอย่างไร ตัวอย่างเช่น ในแวดวงธุรกิจ Healthcare เช่น การตรวจดูภาพสมอง x-ray สมอง ปอด โรคที่เกิดขึ้นบ่อยๆ AI ก็จะทำงานกับโรคบางอย่างได้ดี
หรืออีกตัวอย่างที่เป็นที่วิพากษ์วิจารณ์กัน คือ Face recognition โดยทำการเปรียบเทียบสีผิวเทียบกับรูปใน passport ซึ่งการใช้ Data setคนทางชาติตะวันตกเทรนมากับคนผิวขาวมากเป็นพิเศษทำให้ AI ไม่สามารถทำงานได้ดีกับคนผิวคล้ำ จึงเป็นที่วิพากษ์วิจารณ์ ทำให้คนที่เป็นกลุ่ม minority ของ Data set ไม่สามารถใช้งานและเข้าถึงประโยชน์ของ AI เหล่านี้ได้ รวมทั้งอีกหนึ่งตัวอย่างตามคลิปวิดีโอด้านล่างนี้ เมื่อ AI เห็นผู้หญิงผิวคล้ำแต่กลับมองว่าเป็นผู้ชาย แสดงว่า AI ถูกเทรนมาไม่เพียงพอ
โดยสิ่งเหล่านี้เรียกว่า Survivor Bias คือ Bias ที่เราเห็นจากสิ่งที่รอดมาให้เราเห็น ที่มามีมาตั้งแต่สงครามโลกครั้งที่ 2 เครื่องบินโดนยิงรอดกลับมาที่ฐานทัพได้ โดยเอารอยกระสุนมา plot จุด และคิดว่าควรทำจุดที่โดนยิงให้แข็งแรงขึ้น แต่มีนักวิจัยแย้งว่าควรทำจุดที่ไม่โดนยิงให้แข็งแรงมากกว่า เพราะหากโดนยิง Plot เหล่านี้ก็ยังรอดกลับมาได้
ตัวอย่าง Survivor Bias สำหรับ AI และ Machine learning ได้แก่
- Disease Prediction : โรคบางโรคที่เราสังเกตอาจเป็นกรณีรอดชีวิต แต่ไม่ได้สังเกตคนที่ไม่ได้รอดชีวิต หากไม่นำ Input data เหล่านั้นมาพิจารณา Model ก็จะไม่สมบูรณ์
- Fraud Prevention (กรณีเกิดความผิดปกติ การตรวจจับการทุจริต) : ส่วนใหญ่ข้อมูลที่นำมาเทรน และโดนจับได้ว่าเป็นการทุจริต เราก็จะโฟกัสแค่ส่วนนั้น ไม่ได้พิจารณาถึงส่วนอื่นก็จะเป็น Survivor bias ในทาง AI และ Machine learning
ในส่วนของวิธีแก้ไขปัญหาเรื่อง Survivor bias นั้น ทำได้ดังต่อไปนี้
- การรับรู้ว่าปัญหานี้สามารถเกิดขึ้นได้
- หลังจากนั้นให้เก็บข้อมูลเพิ่มเติม เพื่อป้องกันเรื่อง Bias เช่น เทรนรูปภาพคนผิวสีให้มากขึ้น เพื่อให้ Balance คนผิวขาวที่มากกว่าใน data set เพื่อให้ treat data ได้แฟร์มากขึ้น
- ปรับแต่งค่าพารามิเตอร์ของการเทรน AI
- ใช้โมเดลที่ทำให้เราเข้าใจว่าเกิดอะไรขึ้นในโมเดล เพื่อทำให้ผู้พัฒนสามารถจับ Bias ได้
4. ใช้กระบวนการในการตรวจสอบ และดำเนินการอย่างรวดเร็ว
Ethical AI เป็นเรื่องของการนำ AI ไปใช้งานจริงว่าเหมาะสม หรือไม่เหมาะสมอย่างไรกับการใช้ชีวิตของมนุษย์ ไม่มีใครสงสัยในศักยภาพของปัญญาประดิษฐ์ แต่บางคนอาจจะสงสัยว่า AI นั้นจะถูกนำมาใช้ในทางที่ดีหรือไม่ดี
ตัวอย่างแรก คือการเหยียดผิว ซึ่งหลายครั้งถ้าเราเอาตาม data เลยอาจจะเกิดเหตุการณ์ที่ว่าพอเรามีเก็บข้อมูลของคนที่กระทำความผิดมาซึ่งเป็นคนผิวสีมากกว่าคนผิวขาว พอครั้งต่อมาพอ AI ใช้ข้อมูลเหล่านี้ในการคาดการณ์ก็จะทำให้เกิด Bias หรืออคติที่ทำให้เกิด Ethical issue ที่โน้มเอน ซึ่งในแง่ของการใช้งานจริงก็ไม่เหมาะสม ถ้าคนผิวสีเป็นคนดีแต่กลับเจอระบบที่ไม่แฟร์ ก็จะมีปัญหาเกิดขึ้น
หรือตัวอย่างเรื่องการสมัครงาน เช่น การเทรนข้อมูลของ AI ในบางตำแหน่งของธุรกิจอาจจะมีข้อมูลที่บ่งบอกว่าคนที่เป็นผู้จัดการส่วนใหญ่เป็นผู้ชาย พอเป็นแบบนี้ครั้งต่อไป AI ก็จะคาดการณ์ความโน้มเอียงโดยเลือกผู้ชายให้เข้าไปอยู่ในตำแหน่งที่เป็น Manager ทั้งที่จริงแล้วไม่ได้เป็นการตัดสินว่าผู้หญิงหรือผู้ชายทำงานนี้ได้ดีกว่ากัน เพียงแต่ข้อมูลที่ผ่านมามีลักษณะเป็นอย่างนั้นทำให้เกิดความโน้มเอียง และการปฏิเสธที่ไม่แฟร์ได้
แล้วเราจะมีวิธีป้องกันเรื่อง Ethical AI ได้อย่างไร?
- เข้าใจว่า AI เป็นแค่อัลกอริทึมที่เรียนรู้มาจาก Data สอนอย่างไรได้ผลออกมาอย่างนั้น
- สิ่งที่ธุรกิจควรทำคือมีการติดตาม และ Action อย่างรวดเร็ว ถ้าหากเกิดอะไรที่ไม่เหมาะสม อาจจะต้องใช้คน หรือระบบการติดตาม
- กระบวนการหลังประมวลผลคำตอบ : มีระบบในการตรวจจับ และกรองส่วนที่ไม่เหมาะสมออกไป
- ปรับจูนการเทรนอัลกอริทึมให้เหมาะสม
- จัดระเบียบข้อมูล ถ้าข้อมูลไม่ดี ควรกรองออกไปตั้งแต่แรกก่อนทำการเทรน
5. การฝึกโมเดลใหม่โดยคำนึงถึง Model drift
Model Drifts เป็นเรื่องของโมเดล Performance ที่เทรนมาเปลี่ยนแปลงไปตามกาลเวลา ซี่งการ Drift ก็มีหลายชนิด ได้แก่
- Concept drift : ธรรมชาติของกฎ และการเกิดขึ้นของข้อมูลเปลี่ยนแปลงไป เช่น คำนิยามของสุนัข และแมวเปลี่ยนไป สุนัขพันธุ์ใหม่คล้ายแมวมาก จะทำให้โมเดลที่เราเทรนใช้งานได้ไม่ดีเหมือนเดิม
- Data drift : โมเดลอาจจะใช้งานได้ดี แต่มีการเปลี่ยนแปลงตามฤดูกาล หรือเทรนด์เปลี่ยน เช่น โมเดลก่อนหน้านี้ของลูกค้า คนสนใจไอโฟน มากกว่าซัมซุง แต่ตอนนี้ซัมซุงได้รับความนิยมมากขึ้น ก็ทำให้โมเดลใช้งานได้ไม่ดีอีกต่อไป
- Upstream data changes : ข้อมูลก่อนเข้าโมเดลมีการเปลี่ยนแปลง อย่างเช่น การ encoding เปลี่ยน Format จากเดิม หรือการคลีนข้อมูลที่เปลี่ยนไป
สิ่งที่เราควรทำคือตรวจจับ หรือ Detect ให้ได้ก่อน ตรวจดูการ Label และสังเกตการเปลี่ยนแปลง หรือดูผลการคาดการณ์จาก distribution ดู Outliner หากมีมากขึ้นแปลว่าโมเดลทำงานได้แย่ลง ต้องเทรนใหม่เพื่อให้ความแม่นยำเพิ่มขึ้น และฝึกโมเดลใหม่โดยคำนึงถึง Model drift อยู่เสมอ
6. โฟกัสในการใช้ข้อมูลที่เป็นระบบ (Data-centric AI)
จุดอ่อนอีกข้อของ AI โดยเฉพาะ Deep Learning คือการต้องใช้จำนวนข้อมูลมหาศาลในการสอนให้ AI ฉลาด และสามารถทำงานได้ดี ถ้าเราเริ่มจากโมเดลที่ไม่เคยเทรนก็จะทำให้ AI ไม่สามารถทำงานได้ดีได้ หากเรามี data set ค่อนข้างน้อย
ตัวอย่างเช่น จุดอ่อนอันนึงที่เทียบได้กับเด็ก 4 ขวบ คือ เด็ก 4 ขวบเห็นตัวอย่างไม่กี่ตัวอย่างก็รู้ว่าอันนี้คือ สุนัข หรือแมว แต่ Deep Learning นั้นต้องใช้ตัวอย่างเป็นพันๆ กว่าจะได้ AI ที่สามารถตัดสินได้ดี
และอุปสรรคที่สำคัญของหลายธุรกิจคือ ไม่มีข้อมูล และไม่เคยเก็บข้อมูล เก็บยาก มีค่าใช้จ่าย เช่น แรงงานคน เวลาในการทำ Equipment storage อีกหลายอย่างที่เกี่ยวข้องกับข้อมูล ซึ่งสามารถมีวิธีการรับมือ หรือแก้ไขปัญหาได้ดังต่อไปนี้
- Data-centric AI : ต้องโฟกัสข้อมูลเป็นระบบ เทรนให้สำเร็จด้วยข้อมูลที่น้อยลง
- เริ่มจากโมเดลที่มีคนเทรนจากข้อมูลมหาศาลก่อนหน้านี้ได้ เช่น Image recognition, Image segmentation และ Natural Language understanding
- พัฒนาคุณภาพของการทำ Data labeling ให้มีความสม่ำเสมอมากขึ้น
- Synthetic data โดยการใช้ Code generate data เช่น Self driving car
- Data augmentation ตัวอย่างเช่น เรามีรูปสุนัขรูปเดียว แต่สามารถ Augmentation ปรับภาพได้หลายแบบ ทำให้ AI ฉลาดมากขึ้น Recognize ให้ AI ทำงานได้ดี
รับมือกับความไม่เพอร์เฟคของ AI ด้วยขั้นตอนการทำงานที่ดี
AI ก็เหมือนกับคนที่ต้องมีการเรียนรู้อยู่เสมอ เพื่อทำให้สามารถทำงานได้ดียิ่งขึ้น และลดข้อผิดพลาดที่อาจจะเกิดขึ้น ดังนั้นการเข้าใจถึงจุดเด่น และข้อจำกัดของเทคโนโลยี AI ทำให้ธุรกิจสามารถที่จะใช้ประโยชน์จากจุดแข็งของ AI ได้อย่างเต็มที่ ในขณะเดียวกันสามารถหาวิธี หรือกระบวนการที่จะรับมือข้อจำกัดบางอย่างของ AI ได้เป็นอย่างดีเช่นกัน เพื่อให้ AI สามารถตอบโจทย์การทำงานของธุรกิจได้มากที่สุด
หากธุรกิจของคุณกำลังวางแผนที่ต้องการนำโซลูชัน AI ไปใช้กับธุรกิจ AI GEN บริษัทที่ให้บริการครอบคลุมมากที่สุดเกี่ยวกับเทคโนโลยี AI ที่จะช่วยให้องค์กรของคุณพัฒนาอย่างก้าวกระโดดด้วยความทันสมัย พร้อมมอบบริการ AI Consulting ที่ครอบคลุม ยินดีให้คำปรึกษาตั้งแต่ขั้นตอนการวางแผน และการออกแบบระบบ จนถึงการนำ AI ไปใช้งานให้ตอบโจทย์ธุรกิจ และประสบผลสำเร็จ ด้วยประสบการณ์ และความเชี่ยวชาญการให้บริการโซลูชัน AI มากับหลากหลายธุรกิจ สามารถติดต่อเพื่อปรึกษากับผู้เชี่ยวชาญของเราได้ที่นี่
ทีมงานผู้เชี่ยวชาญด้าน AI อัจฉริยะ พร้อมช่วยขับเคลื่อนการทำงานของธุรกิจ มีประสบการณ์ให้บริการโซลูชัน AI เพื่อองค์กรระดับประเทศมากมาย