พามารู้จักซอฟต์แวร์ OCR น่าใช้ ครบทั้งแบบฟรีและมีค่าบริการ
AI-Powered OCR คือหนึ่งในเทคโนโลยีที่ได้เข้ามามีบทบาทสำคัญกับการทำธุรกิจในยุคปัจจุบัน โดยเฉพาะธุรกิจที่เติบโตอย่างรวดเร็ว โดยการใช้ประโยชน์จากกระบวนการทำงานในรูปแบบดิจิทัล และแบบอัตโนมัติให้เกิดประโยชน์ โดยซอฟต์แวร์ OCR จะทำการดึงข้อมูล และแปลงตัวอักษรที่อยู่ในเอกสารสแกน และรูปสแกน หลังจากนั้นจึงทำการประมวลผลข้อมูลในเอกสารเหล่านั้นให้เป็นดิจิทัลด้วยความสะดวก และอยู่ในรูปแบบที่สามารถแก้ไขได้ที่สอดคล้องกับกระบวนการทำงานของแต่ละธุรกิจ
จากเดิมที่การสแกนและประมวลเอกสารทั้งใบแจ้งหนี้ ใบเสร็จรับเงิน หรือรูปที่มีข้อมูลที่สำคัญ จะทำโดยใช้วิธีการแมนนวล กล่าวคือใช้พนักงานในการประมวลผล และกรอกข้อมูลเข้าไปในระบบทั้งหมด บางครั้งจึงทำให้เกิดปัญหาเรื่องข้อมูลผิดพลาด และล่าช้าได้ โปรแกรม OCR ที่รองรับภาษาไทยจึงกลายมาเป็นโซลูชันที่จะช่วยแก้ไขปัญหานี้ให้กับธุรกิจ ทำให้ธุรกิจประหยัดเวลา และทรัพยากรได้เป็นอย่างมาก ต่างจากการทำงานในแบบแมนนวล ที่ทั้งเสียทั้งเวลา และมีโอกาสที่ข้อมูลจะผิดพลาดสูง
และด้วยความก้าวหน้าของเทคโนโลยีในปัจจุบัน ทำให้ซอฟต์แวร์ OCR ถูกพัฒนาให้มีความสามารถที่มากขึ้น โดยการมีเทคโนโลยี AI อยู่เบื้องหลัง ช่วยให้ซอฟต์แวร์ OCR ในปัจจุบันก้าวข้ามผ่านเรื่องข้อจำกัดเดิมที่มีไปได้ เช่น การอ่านเอกสารที่ไม่ได้มีรูปแบบตายตัว และอ่านลายมือได้ รวมถึงเอกสารที่มีความชัดต่ำ ก็สามารถประมวลผลได้ เป็นต้น เพราะเหตุนี้จึงทำให้หลาย ๆ องค์กรในปัจจุบันได้นำกระบวนการจัดการเอกสารแบบอัตโนมัติไปใช้งาน เพื่อเปลี่ยนให้เป็นองค์กรไร้กระดาษ (Paperless) และใช้ประโยชน์จากโซลูชันของโปรแกรม OCR ให้เกิดประโยชน์สูงสุด เพื่อเพิ่มกำไร ลดค่าใช้จ่ายให้กับบริษัท อีกทั้งยังสร้างประสบการณ์ที่น่าประทับใจให้แก่ลูกค้ากับกระบวนการส่งเอกสารที่ดีขึ้นได้อีกด้วย
OCR คืออะไร และซอฟต์แวร์ OCR ทำงานอย่างไร?
OCR หรือ Optical Character Recognition คือเทคโนโลยีที่ใช้ในการระบุ และจำแนกตัวอักษรในเอกสารสแกน, รูปภาพเอกสารต่าง ๆ โดยที่ Traditional OCR หรือ OCR รูปแบบเดิมที่ได้มีมานานกว่าสิบปี ซึ่งมักจะมีปัญหาเรื่องความแม่นยำ และความไม่เข้าใจในบริบทของตัวหนังสือในภาพเอกสาร โดยซอฟต์แวร์ OCR รูปแบบเดิมจะมีหน้าที่แปลงรูปตัวหนังสือให้เป็นอักขระที่ถูกต้องเท่านั้น
อย่างไรก็ตาม ในปัจจุบันด้วยเทคโนโลยี AI ที่ได้ถูกพัฒนาแบบก้าวกระโดดทำให้ AI-Powered OCR หรือก็คือ OCR ประสิทธิภาพสูงที่นอกจากจะอ่านตัวหนังสือได้ด้วยความแม่นยำสูงได้แล้ว ยังสามารถเข้าใจรูปแบบของเอกสารแต่ละประเภทได้ โดยที่ธุรกิจไม่จำเป็นต้องสร้างเทมเพลตทุกครั้ง ทำให้ระบบ OCR ยุคใหม่รู้ได้ว่าข้อมูลที่ต้องการสำหรับนำไปใช้ในกระบวนการทางธุรกิจอยู่ที่ไหน เช่น ชื่อ-นามสกุล เลขประจำตัว ข้อมูลในตาราง เป็นต้น
ประโยชน์ของโปรแกรม OCR ที่รองรับภาษาไทย
การดำเนินการทางเอกสารของไทยในปัจจุบันได้มีการนำซอฟต์แวร์ OCR ไปใช้ประโยชน์ในหลากหลายรูปแบบ เช่น ดึงข้อมูลตารางจากไฟล์ PDF ดึงข้อความจากรูปภาพ หรือดึงข้อความจากไฟล์ PDF หรือรูปแบบเอกสารอื่น ๆ ที่ไม่สามารถแก้ไขได้ เพื่อแปลงให้กลายเป็นเวอร์ชันที่สามารถทำการปรับปรุง แก้ไข และจัดเก็บไว้อย่างเป็นระบบเพื่อให้สะดวกในการเรียกใช้งานครั้งต่อไป
ในปัจจุบันเทคโนโลยี AI Powered-OCR ได้นำไปใช้ในการกรอกข้อมูลแบบอัตโนมัติ การจำแนกรูปแบบเอกสาร การแปลงรูปเป็นข้อความ การทำดัชนีของเอกสารเพื่อให้สามารถค้นหาได้ เป็นต้น โดยซอฟต์แวร์ OCR สามารถแปลงไฟล์เอกสารสแกน เอกสาร PDF หรือรูปภาพต่าง ๆ ให้เป็นไฟล์ xlsx, csv หรือ JSON ได้
7 ซอฟต์แวร์ OCR ที่รองรับภาษาไทย ทั้งแบบฟรีและเสียค่าใช้จ่าย!
1) aiScript (ไอสคริปต์)
aiScript เป็นซอฟต์แวร์ AI-Powered OCR ราคาสมเหตุสมผลที่ทางไอเจ็นได้พัฒนาขึ้นมา รองรับประสิทธิภาพของกระบวนการเก็บข้อมูล และประมวลผลจากเอกสารได้แบบอัตโนมัติทั้งเอกสารที่มีรูปแบบที่แน่นอน ได้แก่ บัตรประชาชน ทะเบียนบ้าน ใบขับขี่ และเอกสารที่ไม่ได้มีรูปแบบตายตัว ได้แก่ ใบเสร็จรับเงินและใบกำกับภาษี แบบฟอร์มของแต่ละบริษัท เป็นต้น
ด้วยความแม่นยำสูง และยังรองรับทั้งเอกสารภาษาไทย และภาษาอังกฤษรวมถึงอ่านลายมือได้ ไอเจ็นได้ใช้เทคโนโลยี Machine learning และ Deep learning ในการดึงข้อมูลที่เกี่ยวข้องจากข้อมูลที่อยู่ในรูปแบบ Unstructured data และนำมาใส่ในตารางที่เป็น Structured format ที่คนหรือซอฟต์แวร์อื่น ๆ สามารถนำไปใช้ต่อได้ง่าย อีกทั้งยังมีให้บริการทั้งในรูปแบบ On cloud และแบบ On-premise ได้ตามความต้องการของลูกค้า
ข้อดี
- มีความแม่นยำสูง ด้วยการใช้โมเดล AI ที่เทรนมาจากประเภทของเอกสารและ Font ที่หลากหลาย
- เป็นโปรแกรม OCR ที่รองรับทั้งภาษาไทย และภาษาอังกฤษ
- รองรับการประมวลผลประเภทของเอกสารสูงถึง 20 ประเภท
- รองรับทั้งเอกสารที่มีรูปแบบแน่นอน และเอกสารที่ไม่ได้มีรูปแบบแน่นอน
- สามารถดึงข้อมูลจากแต่ละประเภทของเอกสารได้ตามที่ต้องการโดยรู้ความหมายของข้อมูลว่าเป็นข้อมูลอะไร และนำไปใส่ในตารางที่เป็น Structured format ที่คนหรือซอฟต์แวร์อื่นๆสามารถนำไปใช้ต่อได้ง่าย
- รองรับการประมวลผลหลายภาพเอกสารในรูปเดียวกันแม้ เช่น กรณีมีภาพทะเบียนบ้านติดอยู่ในภาพสแกนรูปบัตรประชาชน
- สามารถ Customize model ให้เข้ากับเอกสารจำเพาะของแต่ละองค์กร และเทรนให้มีความแม่นยำขึ้นได้อยู่เสมอ
- สามารถอ่านข้อมูลจากรูปตารางในเอกสาร และอัปโหลดลง Spreadsheet พร้อมทั้งแยกแยะแต่ละประเภทของเอกสารได้
- สามารถนำซอฟต์แวร์ OCR aiScript ไป Integrate กับ Application อื่นได้ผ่าน API
- ให้ธุรกิจสร้าง Data-entry workflow ที่ตอบโจทย์กับธุรกิจได้
ข้อจำกัด
- บางโมเดลยังอยู่ในเวอร์ชั่น Beta
2) Google Vision/Google Document AI
โปรแกรม Google Vision OCR รองรับภาษาไทยและอีกหลากหลายภาษา ลักษณะการให้บริการจะมีเฉพาะรูปแบบ API สำหรับนำไปเชื่อมต่อกับซอฟต์แวร์แอปพลิเคชันเท่านั้น ถือว่าตอบโจทย์ผู้ใช้งาน Google Cloud เป็นอย่างมาก อย่างไรก็ตาม Google Vision OCR ถือว่าเป็นซอฟต์แวร์ OCR ที่มีราคาค่อนข้างถูกมาก และเมื่อไม่นานมานี้ Google ได้เปิดตัว Document AI มาเพื่อบริการด้านการดึงข้อมูลจากเอกสารที่มีโครงสร้างมากขึ้น เช่น ฟอร์มจ่ายภาษี ใบเสร็จรับเงินและใบกำกับภาษี เป็นต้น
ข้อดี
- รองรับภาษาไทย
- ราคาไม่แพง
- สามารถนำไป Integrate กับ Application อื่นได้ผ่าน API
ข้อจำกัด
- ไม่เข้าใจโครงสร้าง (structure) ของเอกสาร
- Return ผลการเจอตัวหนังสือเป็น Raw text เท่านั้น ไม่ได้มีความเข้าใจว่า ตัวไหนเป็นเลข ID ตัวไหนเป็นชื่อ
- ไม่สามารถแยกแยะแม้แต่ Key จาก Value (key-value คือ ลักษณะตัว text field ที่อยู่คู่กัน เช่น เลขบัตรประชาชน (key) จะมีตัวข้อมูลอยู่ข้างๆว่า 1234567890123 (value)) และถ้าไม่มีตัว Key ทำให้ผู้ใช้ต้องมาแยกแยะเองว่า Value ที่ต้องการอยู่ตรงไหนจากเอกสารที่ต้องการดึงข้อมูล
- ให้บริการผ่าน Cloud เท่านั้น
- ทั้ง Google Vision OCR หรือ Document AI ไม่สามารถนำมา Customize หรือ Fine-tune ให้เข้ากับเอกสารใหม่ๆ ของแต่ละองค์กรได้
3) Abbyy FineReader & FlexiCapture
Abbyy FineReader เป็นซอฟต์แวร์ OCR suite จาก Abbyy ที่สามารถแปลงข้อมูลตัวหนังสือจาก PDF ไปเป็นตัวอักษร และรองรับภาษาไทย นอกจากนี้ยังมีฟีเจอร์อีกหลายอย่างที่ช่วยในการจัดการเอกสารอิเล็กทรอนิกส์
ข้อดี
- รองรับภาษาไทย
- ฟีเจอร์ที่รองรับการจัดการเอกสารอิเล็กทรอนิกส์ เช่น User Interface ที่ดูง่าย และการเปรียบเทียบเอกสาร
- มีให้บริการติดตั้งแบบ On-premise
ข้อจำกัด
- License มีราคาแพง
- ความแม่นยำในการอ่านเอกสารไม่สูงมากนัก ถึงแม้ว่าจะเป็นรูปแบบ text ธรรมดาทั่วไป
- ไม่สามารถรองรับเอกสารที่มีลักษณะเป็นโครงสร้าง
- ไม่สามารถ Customize หรือ Re-train ให้เข้ากับชุดเอกสารของแต่ละธุรกิจได้
Abbyy มีผลิตภัณฑ์ซอฟต์แวร์ที่สามารถทำ OCR ได้อีกหนึ่งตัว นั่นคือ Abbyy FlexiCapture โดยเน้นไปที่ Intelligent Document Processing ทั้งกระบวนการตั้งแต่การแยกแยะเอกสาร การเชื่อมต่อกับระบบอย่าง ERP และการจัดการสิทธิ์ในการทำงาน ทำให้มีครบทั้งโซลูชันสำหรับการจัดการเอกสารทั้ง Workflow และรองรับภาษาไทยแต่ความแม่นยำโดยทั่วไปต่ำกว่า Google Vision OCR นอกจากนี้ ราคาของ Abbyy FlexiCapture ก็ยังค่อนข้างแพง ในขณะที่รองรับได้แค่เอกสารที่มีลักษณะเป็นเทมเพลตเท่านั้น และวิธีการติดตั้งก็ค่อนข้างยุ่งยากอีกด้วย
4) PDF Converter หรือ PDF Copy
หลายคนอาจเคยมีประสบการณ์ Copy-paste ตัว text จาก PDF ได้โดยไม่เห็นต้องใช้โปรแกรม OCR อะไรเป็นพิเศษ จึงสงสัยว่าทำไมต้องใช้โซลูชันเหล่านี้แทนที่จะคัดลอกโดยตรง ก่อนอื่นต้องขอแยกประเภทของ PDF ออก เป็น 2 ประเภท ได้แก่
- Real PDF คือ PDF ที่ถูกสร้างมาแบบดิจิทัล (Digitally Created) จากต้นทาง เช่น Microsoft Word ซึ่งสามารถทำหมายเหตุประกอบ และทำ Highlight ขีดเส้นใต้ข้อความ (Annotate) รวมถึงค้นหาคำในนั้นได้ ซึ่ง PDF ประเภทนี้สามารถทำการ Copy-paste ตัวหนังสือจาก PDF ไปที่อื่นได้ แต่ก็มักจะติดปัญหาโดยเฉพาะกับภาษาไทยที่จะมีเรื่อง encoding เข้ามาทำให้การเรียงพยัญชนะ และสระเกิดความผิดเพี้ยนตามภาพประกอบด้านล่าง
- Scanned PDF คือ PDF ที่ได้มาจากการสแกนเอกสารเป็นรูปภาพ PDF ลักษณะนี้ต้องใช้โปรแกรม OCR ในการแปลงจากรูปตัวหนังสือให้เป็นข้อความเท่านั้น
5) Free online OCR
หากทำการค้นหาใน Google เราสามารถเจอโปรแกรม OCR ภาษาไทยที่ให้บริการฟรีกันอยู่หลายเจ้า ซึ่งวัตถุประสงค์ของการใช้งานโปรแกรม OCR ฟรีนั้นเหมาะแค่กับการใช้งานแบบส่วนบุคคลในการอ่าน และดึงข้อมูลจากเอกสารเพียงไม่กี่หน้าเท่านั้น
ข้อดี
- ใช้งานได้ฟรี และใช้งานง่ายผ่านทางเว็บ Browser
ข้อจำกัด
- ความแม่นยำต่ำ
- สามารถอ่านได้เฉพาะ Raw text
- ไม่สามารถทำเอกสารที่มีโครงสร้างให้ได้ผลที่มีโครงสร้างได้
- ไม่สามารถนำไป Integrate หรือเชื่อมต่อกับซอฟต์แวร์ในกระบวนการทำ งานอื่นๆ
- ไม่สามารถติดตั้ง On-premise หรือพัฒนา Customize เพิ่มเติมได้
6) Tesseract
ถ้าพูดถึงโปรแกรม OCR library รองรับภาษาไทยที่สามารถนำมาใช้ได้ฟรี และติดตั้ง On-premise พร้อมกับ Software Application ที่ต้องการใช้กับโปรแกรม OCR อื่นได้ คงหนีไม่พ้นโปรแกรม Tesseract OCR library
Tesseract เป็นโค้ดและโมเดล OCR ที่เริ่มพัฒนามาจากภายใน Hewlett Packard ซึ่งสุดท้ายได้มีการปล่อยเป็น Open-Source และได้รับการสปอนเซอร์จาก Google ตั้งแต่ปี 2006 ในลักษณะ Open-source แม้จะมีข้อดีมากมายจากที่กล่าวถึงไปแล้ว แต่จุดอ่อนของ Tesseract อย่างความแม่นยำ ทำให้ยากในการนำไปใช้หรือพัฒนาต่อ และทำได้แค่ OCR เท่านั้น แต่ไม่มีโค้ดหรือ AI ที่เข้าใจ Structured Document เหมาะกับงานวิจัย หรือการศึกษาที่นักเรียนสามารถนำไปฝึกใช้ได้
ข้อดี
- สามารถใช้งานได้ฟรี เนื่องจากเป็น Open-source
- รองรับภาษาไทย
ข้อจำกัด
- ความแม่นยำ
- ยากในการที่จะนำไปพัฒนาต่อ
- ไม่สามารถเข้าใจเอกสารที่เป็น Structure ได้
7) NECTEC Thai OCR
ทาง NECTEC เองได้มีผลงานการพัฒนาซอฟต์แวร์ OCR มาอย่างยาวนาน ตั้งแต่เวอร์ชันที่ใช้ในเชิงพาณิชย์โดยการติดตั้งบน Desktop จนปัจจุบันก็มี OCR as a service ให้ทดลองใช้ได้บนแพลตฟอร์ม AI for Thai ซึ่งก็มี OCR โดยบริษัทไทยเจ้าอื่นให้ทดลองใช้ด้วย การนำ OCR service ไปใช้จริงอาจเป็นส่วนที่ไม่สะดวกที่สุดด้วยการขาดซัพพอร์ตสำหรับการนำไปใช้จริงในเชิง commercial
ซอฟต์แวร์ OCR ของ AIGEN แตกต่างจากเจ้าอื่นอย่างไร?
aiScript เป็น AI suite ที่รวบรวมสิ่งที่จำเป็นต่อการประมวลผลรูปเอกสารโดยมี AI อยู่เบื้องหลังการทำงานทั้งหมด นอกจาก OCR ที่ใช้โมเดล AI ที่เทรนมาจากประเภทของเอกสารและ font ที่หลากหลายซึ่งทำให้ความแม่นยำสูง (เช่น เอกสารหนังสือราชการที่สแกนมาชัดเจนมีผลความแม่นยำอยู่ที่ 99%) ซึ่ง aiScript ยังมีโมเดล AI ที่รู้จักเอกสารประเภทต่าง ๆ อย่างครอบคลุม ไม่ว่าจะเป็นเอกสารที่มีรูปแบบตายตัว (template) เช่น บัตรประชาชน ใบขับขี่ สมุดจดทะเบียนรถยนต์ หน้าสมุดบัญชีธนาคาร เอกสารราชการอย่างใบมรณบัตร หรือ เอกสารที่ไม่มีรูปแบบตายตัว (non-template) เช่น ใบแจ้งหนี้ และใบเสร็จรับเงิน ทำให้สามารถดึงข้อมูลจากแต่ละชนิดเอกสารได้ตามที่ต้องการโดยรู้ความหมายของข้อมูลว่าเป็น เลขที่บัตร หรือ ชื่อ-นามสกุล หรือ วันที่หมดอายุ หรือเป็นจำนวนเงินรวม (Total amount) แล้วใส่ในตารางที่เป็น structured format ที่คนหรือซอฟต์แวร์อื่น ๆ สามารถนำไปใช้ต่อได้ง่าย
นอกจากนี้บริการ OCR เจ้าต่าง ๆ ในไทยยังมีปัญหาที่ไม่รองรับหากมีหลายภาพเอกสารส่งมาในรูปเดียวกันกับเอกสารที่ต้องการ เช่น มีทะเบียนบ้านปนมาในสแกนรูปบัตรประชาชน รวมทั้งไม่รองรับการถ่ายภาพในแนวที่ไม่ใช่แนวตั้ง ส่วนลายน้ำบนกระดาษที่ซ้อนทับตัวหนังสือ ซึ่งมีอยู่ในหลายชนิดเอกสาร เช่น ใบมรณบัตร กรมธรรมรถยนต์ หรือเอกสารราชการ ก็มักจะทำให้มีปัญหาเรื่องความแม่นยำ แม้แต่ปั๊มตรายางบนกระดาษ aiScript ก็สามารถตรวจหา และทำให้ลดผลกระทบต่อการอ่าน OCR บนหน้ากระดาษได้
ความสามารถของโปรแกรม aiScript อย่างยังรวมไปถึงการอ่านข้อมูลจากรูปตารางในเอกสารไปลง Spreadsheet ได้ แยกแยะแต่ละประเภทของเอกสาร และเทียบความแตกต่างระหว่างรูปเอกสาร ทำให้การทำงานกับรูปภาพเอกสารในธุรกิจมีความครบวงจร ตอบโจทย์กับทุกธุรกิจ การใช้งานสามารถเรียกใช้งานผ่าน API ได้อย่างง่ายดาย ทำให้การนำไปเชื่อมต่อกับ Business process software อื่นเป็นเรื่องง่าย และค่าใช้จ่ายจะแตกต่างกันตามประเภทของเอกสาร และปริมาณเอกสารที่ต้องการใช้งาน หากต้องการติดตั้งแบบ On-premise ก็สามารถทำได้ อีกทั้งสามารถ Customize model ให้เข้ากับเอกสารจำเพาะขององค์กร และเทรนให้มีความแม่นยำขึ้นได้อยู่เสมอ
ปัจจัยสำคัญในการเลือกใช้ ซอฟต์แวร์ OCR ให้ตอบโจทย์ธุรกิจ
- การดึงข้อมูล
โปรแกรม OCR จะแปลงไฟล์ PDF ให้เป็นเอกสารที่สามารถแก้ไขได้อย่างง่ายดาย รองรับภาษาไทย สามารถช่วยอำนวยความสะดวกในการนำข้อมูลจำเป็นไปใช้ยืนยันตัวตนในระบบ เช่น เลขบัตรประชาชน และชื่อ-นามสกุล ซึ่งซอฟต์แวร์ OCR ที่ดี ควรรองรับภาษาไทย และมีความสามารถในการตรวจเช็กเอกสารได้อย่างแม่นยำ และสามารถบ่งชี้ความผิดปกติตามชนิดและฟิลด์ของเอกสารได้ เช่น แจ้งเตือนเมื่อเลขบัตรประชาชนไม่ครบ 13 หลัก เป็นต้น
- การพัฒนาบริการเพิ่มเติม และงบประมาณที่ใช้
ในกรณีที่เอกสารของคุณมีรูปแบบเฉพาะ ซึ่ง AI-powered OCR ยังไม่มีเอกสารรูปแบบนี้ในระบบพร้อมสำหรับใช้งาน กรณีนี้จะต้องมีการพัฒนาเพิ่มเติมเสียก่อน จึงต้องใช้เวลา (Lead time) และมีค่าใช้จ่าย เพิ่มเติม และถ้าหากต้องการหลายฟอร์ม ก็จะทำให้ค่าใช้จ่ายในส่วนนี้เพิ่มขึ้นแบบทวีคูณ ซึ่งซอฟต์แวร์ระบบ OCR ที่ดีควรจะมี Turn-around time ที่รวดเร็ว ค่าใช้จ่ายที่สมเหตุสมผล หรือมีทางเลือกให้สามารถเทรนแบบฟอร์มที่ต้องการได้เอง แต่ผู้ให้บริการ OCR บางรายก็ยังไม่สามารถมอบบริการในส่วนนี้ได้
- นำไปใช้ร่วมกับระบบอื่นได้สะดวกหรือไม่?
ซอฟต์แวร์ระบบ OCR ที่ดี ควรสามารถนำไปใช้ร่วมกับระบบอื่นที่อยู่ในกระบวนการทางธุรกิจได้ง่าย การใช้บริการผ่าน API จะสามารถทำให้การเรียกใช้งาน OCR นำไปใช้ได้กับหลายระบบพร้อม ๆ กัน ไม่ว่าจะเป็น Mobile app, Web app หรือ ระบบ CRM นอกจากนี้ ยังต้องควรทดสอบโดยการใช้กับกระบวนการ Onboarding ตั้งแต่แรก รวมถึงการนำ API ไปทดลองใช้ใน UAT environment ที่จะไม่กระทบกับระบบจริง (production) และสุดท้ายคือการนำไปเชื่อมต่อใน Production ด้วย Service Level ของการใช้งานจริง
- On-premise vs. On-cloud
ด้วยกฎหมายข้อมูลส่วนบุคคลที่เคร่งครัด บางธุรกิจอาจยังมีความไม่สบายใจในการส่งออกรูปภาพเอกสาร หรือข้อมูลส่วนบุคคลออกไปยัง Cloud ทำให้ On-premise ยังเป็นทางเลือกที่ยังต้องมีให้บริการอยู่ ซอฟต์แวร์ OCR ที่ดีควรมีความสามารถในการนำไปใช้งาน On-premise ได้โดยที่ทางธุรกิจสามารถเป็นผู้จัดซื้อฮาร์ดแวร์ได้เองด้วย
- การสนับสนุนและบริการ
การมีคนช่วยสนับสนุน หรือซัพพอร์ตเวลาเกิดปัญหา หรือ Customize โซลูชันให้เข้ากับธุรกิจของเรา เป็นสิ่งที่หลายธุรกิจให้ความสำคัญเป็นอย่างมาก นอกจากนี้ผู้ให้บริการโปรแกรม OCR ของคนไทย หรือมีสำนักงานอยู่ในไทยเองนั้น จะมีความใกล้ชิดกับธุรกิจทำให้ธุรกิจจะได้รับการซัพพอร์ตได้อย่างรวดเร็ว และมีโอกาสรับฟัง Feedback จากลูกค้าอย่างใกล้ชิด เพื่อนำไปปรับปรุงผลิตภัณฑ์ให้ดียิ่งขึ้น
- ฟีเจอร์เสริม และ Roadmap ในการพัฒนาระบบ
ซอฟต์แวร์ OCR ที่ดีอาจมีตัวช่วยเรื่องการทำงาน ไม่เพียงแค่จัดการเรื่อง OCR ให้เท่านั้น แต่ยังมีตัวช่วยในการตัดสินใจ เช่น Confidence score ที่บ่งบอกความน่าจะเป็นในความแม่นยำของผลลัพธ์นั้น อาจมีการทำ Business logic จากผลการดึงข้อมูลโดยอัตโนมัติได้ เช่น การตรวจเช็คว่าชื่อบนรูปบัตรประชาชนตรงกับในรูปของแบบฟอร์มเอกสารหรือไม่ หรือสามารถกำหนดเงื่อนไขของ Straight-through processing ได้ผ่านการตั้งเงื่อนไขจากผลของ OCR และ Confidence score นอกจากนี้ผู้ให้บริการ OCR ที่ดีควรมีการเสริมสร้างความแข็งแกร่งของ Product หรือ Re-train และพัฒนาโมเดล AI อยู่เสมอ และมี Roadmap ที่ทำให้ซอฟต์แวร์ที่ธุรกิจได้ลงทุนนำไปใช้งานนั้นมีความสามารถที่ดีขึ้นได้เรื่อย ๆ เพื่อให้เกิดความคุ้มค่าในระยะยาวกับธุรกิจ
- ภาพรวมของธุรกิจ
แน่นอนว่าสิ่งที่สำคัญสำหรับการเลือกใช้ซอฟต์แวร์ OCR ส่วนหนึ่งคือต้นทุนในการใช้งาน ราคาที่ถูกอาจไม่ใช่คำตอบสุดท้ายเสมอไป หากถ้าพิจารณาจากความแม่นยำ หรือการใช้งานที่ไม่ตอบโจทย์ธุรกิจ สุดท้ายอาจทำให้ภาพรวมการนำไปใช้นั้นมีต้นทุนสูงกว่าค่าใช้จ่าย OCR ชุดโปรแกรม OCR ที่มีคุณภาพอาจทำให้ลดปริมาณงานลงได้จริง ทำ Straight-through processing ของกระบวนการธุรกิจได้มากกว่า ทำให้ความคุ้มค่าของการใช้งานสูงกว่าแม้ราคาของระบบ OCR จะแพงกว่าก็ตาม นอกจากนี้ควรคำนึงถึงคุณค่าของข้อมูลที่ดึงออกมาว่าอาจมีค่าต่อธุรกิจอีกมาก จากเดิมข้อมูลเหล่านี้อยู่ในรูปแบบ Pixel ที่ไม่สามารถนำไปวิเคราะห์ต่อได้ การทำ OCR จะทำให้ข้อมูลจากเอกสารสามารถถูกนำมาอยู่ในรูปแบบที่ใช้งานต่อได้ในยุคที่ข้อมูลเป็นเหมือนทองหรือน้ำมัน คุณค่าจากข้อมูลที่ได้อาจมากกว่าต้นทุนในการทำ OCR ก็เป็นได้
ในขณะเดียวกันความแม่นยำในการแปลงแต่ละตัวอักษรก็สำคัญแต่เป็นแค่มิติการใช้งานเพียงด้านเดียว เช่นเดียวกับเรื่องราคา ควรพิจารณาให้รอบด้านก่อนเลือกซอฟต์แวร์ระบบ OCR ที่จะนำมาใช้ในธุรกิจ
หากคิดว่า aiScript ซึ่งเป็นโซลูชัน AI-Powered OCR คือทางออกที่ดีที่สุดสำหรับการกระบวนการประมวลผลและเก็บข้อมูลของธุรกิจคุณ และต้องการที่ปรึกษา รวมถึงพาร์ทเนอร์คู่คิด เริ่มปรึกษาพวกเรา AIGEN (ไอเจ็น) ได้ที่นี่เลยค่ะ
ทีมงานผู้เชี่ยวชาญด้าน AI อัจฉริยะ พร้อมช่วยขับเคลื่อนการทำงานของธุรกิจ มีประสบการณ์ให้บริการโซลูชัน AI เพื่อองค์กรระดับประเทศมากมาย