Share

รวม 7 ซอฟต์แวร์ OCR แบบฟรี และมีค่าบริการ ประจำปี 2022 – AI GEN

AI-Powered OCR คือหนึ่งในเทคโนโลยีที่ได้เข้ามามีบทบาทสำคัญกับการทำธุรกิจในยุคปัจจุบัน โดยเฉพาะธุรกิจที่เติบโตอย่างรวดเร็ว โดยการใช้ประโยชน์จากกระบวนการทำงานในรูปแบบดิจิทัล และแบบอัตโนมัติให้เกิดประโยชน์ โดยซอฟต์แวร์ OCR จะทำการดึงข้อมูล และแปลงตัวอักษรที่อยู่ในเอกสารสแกน และรูปสแกน หลังจากนั้นจึงทำการประมวลผลข้อมูลในเอกสารเหล่านั้นให้เป็นดิจิทัลด้วยความสะดวก และอยู่ในรูปแบบที่สามารถแก้ไขได้ที่สอดคล้องกับกระบวนการทำงานของแต่ละธุรกิจ

จากเดิมที่การสแกน และประมวลเอกสารทั้ง ใบแจ้งหนี้ ใบเสร็จรับเงิน หรือรูปที่มีข้อมูลที่สำคัญ จะทำโดยใช้วิธีการแมนนวล กล่าวคือใช้แรงงานพนักงานในการประมวลผลทั้งหมด บางครั้งจึงทำให้เกิดปัญหาเรื่องความผิดพลาด และล่าช้าได้ โปรแกรม OCR จึงกลายมาเป็นโซลูชันที่จะช่วยแก้ไขปัญหานี้ให้กับธุรกิจ ทำให้ธุรกิจประหยัดเวลา และทรัพยากรได้เป็นอย่างมาก ต่างจากการทำงานในแบบแมนนวล ที่ทั้งเสียทั้งเวลา และมีโอกาสผิดพลาดสูง

และด้วยความก้าวหน้าของเทคโนโลยีในปัจจุบัน ทำให้ซอฟต์แวร์ OCR ถูกพัฒนาให้มีความสามารถที่มากขึ้น โดยการมีเทคโนโลยี AI อยู่เบื้องหลัง ช่วยให้ซอฟต์แวร์ OCR ในปัจจุบันก้าวข้ามผ่านเรื่องข้อจำกัดเดิมที่มีไปได้ เช่น การอ่านเอกสารที่ไม่ได้มีรูปแบบตายตัว และอ่านลายมือได้ รวมถึงเอกสารที่มีความชัดต่ำ ก็สามารถประมวลผลได้ เป็นต้น เพราะเหตุนี้จึงทำให้หลาย ๆ องค์กรในปัจจุบันได้นำกระบวนการจัดการเอกสารแบบอัตโนมัติไปใช้งาน เพื่อเปลี่ยนให้เป็นองค์กรไร้กระดาษ (Paperless) และใช้ประโยชน์จากโซลูชันของโปรแกรม OCR ให้เกิดประโยชน์สูงสุด เพื่อเพิ่มกำไร ลดค่าใช้จ่ายให้กับบริษัท อีกทั้งยังสร้างประสบการณ์ที่น่าประทับใจให้แก่ลูกค้ากับกระบวนการส่งเอกสารที่ดีขึ้นได้อีกด้วย

ocr คืออะไร
ภาพประกอบ : Shutterstock

OCR คืออะไร และซอฟต์แวร์ OCR ทำงานอย่างไร

OCR หรือ Optical Character Recognition คือเทคโนโลยีที่ใช้ในการระบุ และจำแนกตัวอักษรในเอกสารสแกน และรูปภาพเอกสารต่างๆ Traditional OCR หรือ OCR รูปแบบเดิมที่ได้มีมานานกว่าสิบปี มักจะมีปัญหาเรื่องความแม่นยำและความไม่เข้าใจในบริบทของตัวหนังสือในภาพเอกสาร โดยซอฟต์แวร์ OCR ในรูปแบบจะมีหน้าที่แปลงรูปตัวหนังสือให้เป็นอักขระที่ถูกต้องเท่านั้น แต่ในปัจจุบันด้วยเทคโนโลยี AI ที่ได้ถูกพัฒนาแบบก้าวกระโดดทำให้ AI-Powered OCR หรือก็คือ OCR ที่มีประสิทธิภาพสูงที่นอกจากจะอ่านตัวหนังสือได้ด้วยความแม่นยำสูงได้แล้ว ยังสามารถเข้าใจรูปแบบของเอกสารแต่ละประเภทได้อีกด้วย และรู้ได้ว่าข้อมูลที่ต้องการสำหรับนำไปใช้ในกระบวนการทางธุรกิจอยู่ที่ไหน เช่น ชื่อ-นามสกุล เลขประจำตัว ข้อมูลในตาราง เป็นต้น

ประโยชน์ของโปรแกรม OCR ที่รองรับภาษาไทย

การดำเนินการทางเอกสารของไทยในปัจจุบันได้มีการนำซอฟต์แวร์ OCR ไปใช้งานในหลากหลายรูปแบบ เช่น ดึงข้อมูลตารางจากไฟล์ PDF ดึงข้อความจากรูปภาพ หรือดึงข้อความจากไฟล์ PDF หรือรูปแบบเอกสารอื่น ๆ ที่ไม่สามารถแก้ไขได้ เพื่อแปลงให้กลายเป็นเวอร์ชันที่สามารถทำการปรับปรุง แก้ไข และจัดเก็บไว้อย่างเป็นระบบเพื่อให้สะดวกในการเรียกใช้งานครั้งต่อไป

ในปัจจุบันเทคโนโลยี AI Powered-OCR ได้นำไปใช้ในการกรอกข้อมูลแบบอัตโนมัติ การจำแนกรูปแบบเอกสาร การแปลงคำพูดเป็นข้อความ การทำดัชนีของเอกสารเพื่อ.ให้สามารถค้นหาได้ เป็นต้น โดยซอฟต์แวร์ OCR สามารถแปลงไฟล์เอกสารสแกน เอกสาร PDF หรือรูปภาพต่างๆให้เป็นไฟล์ xml, xlsx หรือ csv ได้

7 ซอฟต์แวร์ OCR ที่รองรับภาษาไทย ทั้งแบบฟรีและเสียค่าใช้จ่าย!

1) aiScript (ไอสคริปต์)

aiScript เป็นซอฟต์แวร์ AI-Powered OCR ราคาสมเหตุสมผลที่ทางไอเจ็นได้พัฒนาขึ้นมา รองรับประสิทธิภาพของกระบวนการเก็บข้อมูล และประมวลผลจากเอกสารได้แบบอัตโนมัติทั้งเอกสารที่มีรูปแบบที่แน่นอน ได้แก่ บัตรประชาชน ทะเบียนบ้าน ใบขับขี่ และเอกสารที่ไม่ได้มีรูปแบบตายตัว ได้แก่ ใบเสร็จรับเงินและใบกำกับภาษี แบบฟอร์มของแต่ละบริษัท เป็นต้น

ด้วยความแม่นยำสูง และยังรองรับทั้งเอกสารภาษาไทย และภาษาอังกฤษรวมถึงอ่านลายมือได้ ไอเจ็นได้ใช้เทคโนโลยี Machine learning และ Deep learning ในการดึงข้อมูลที่เกี่ยวข้องจากข้อมูลที่อยู่ในรูปแบบ Unstructured data และนำมาใส่ในตารางที่เป็น Structured format ที่คนหรือซอฟต์แวร์อื่น ๆ สามารถนำไปใช้ต่อได้ง่าย อีกทั้งยังมีให้บริการทั้งในรูปแบบของ API และแบบ On-premise ได้ตามความต้องการของลูกค้า

ธุรกิจสามารถทดลองใช้งาน aiScript ฟรี ได้ที่ลิ้งค์ >> https://developer.aigen.online/signup

ข้อดี

  • มีความแม่นยำสูง ด้วยการใช้โมเดล AI ที่เทรนมาจากประเภทของเอกสารและ font ที่หลากหลาย
  • รองรับทั้งภาษาไทย และภาษาอังกฤษ
  • รองรับการประมวลผลประเภทของเอกสารสูงถึง 11 ประเภท 
  • รองรับทั้งเอกสารที่มีรูปแบบแน่นอน และเอกสารที่ไม่ได้มีรูปแบบแน่นอน
  • สามารถดึงข้อมูลจากแต่ละประเภทของเอกสารได้ตามที่ต้องการโดยรู้ความหมายของข้อมูลว่าเป็นข้อมูลอะไร และนำไปใส่ในตารางที่เป็น Structured format ที่คนหรือซอฟต์แวร์อื่นๆสามารถนำไปใช้ต่อได้ง่าย
  • รองรับหลายภาพเอกสารส่งมาในรูปเดียวกับเอกสารที่ต้องการ เช่น มีทะเบียนบ้านปนมาในสแกนรูปบัตรประชาชน
  • สามารถ Customize model ให้เข้ากับเอกสารจำเพาะของแต่ละองค์กร และเทรนให้มีความแม่นยำขึ้นได้อยู่เสมอ
  • สามารถอ่านข้อมูลจากรูปตารางในเอกสารไปลง spreadsheet ได้ และแยกแยะแต่ละประเภทของเอกสาร
  • สามารถนำไป Integrate กับ Application อื่นได้ผ่าน API

ข้อจำกัด

  • บางโมเดลยังอยู่ในเวอร์ชั่น Beta

2) Google Vision/Google Document AI

โปรแกรม Google Vision OCR รองรับภาษาไทยและอีกหลากหลายภาษา ลักษณะการให้บริการจะมีเฉพาะรูปแบบ API สำหรับนำไปเชื่อมต่อกับซอฟต์แวร์แอปพลิเคชันเท่านั้น ถือว่าตอบโจทย์ผู้ใช้งาน Google Cloud เป็นอย่างมาก อย่างไรก็ตาม Google Vision OCR ถือว่าเป็นซอฟต์แวร์ OCR ที่มีราคาค่อนข้างถูกมาก และเมื่อไม่นานมานี้ Google ได้เปิดตัว Document AI มาเพื่อบริการด้านการดึงข้อมูลจากเอกสารที่มีโครงสร้างมากขึ้น เช่น ฟอร์มจ่ายภาษี ใบเสร็จรับเงินและใบกำกับภาษี เป็นต้น

ข้อดี

  • รองรับภาษาไทย 
  • ราคาไม่แพง
  • สามารถนำไป Integrate กับ Application อื่นได้ผ่าน API

ข้อจำกัด

  • ไม่เข้าใจโครงสร้าง (structure) ของเอกสาร 
  • Return ผลการเจอตัวหนังสือเป็น Raw text เท่านั้น ไม่ได้มีความเข้าใจว่า ตัวไหนเป็นเลข ID ตัวไหนเป็นชื่อ 
  • ไม่สามารถแยกแยะแม้แต่ Key จาก Value (key-value คือ ลักษณะตัว text field ที่อยู่คู่กัน เช่น เลขบัตรประชาชน (key) จะมีตัวข้อมูลอยู่ข้างๆว่า 1234567890123 (value)) และถ้าไม่มีตัว Key ทำให้ผู้ใช้ต้องมาแยกแยะเองว่า Value ที่ต้องการอยู่ตรงไหนจากเอกสารที่ต้องการดึงข้อมูล
  • ให้บริการผ่าน Cloud เท่านั้น
  • ทั้ง Google Vision OCR หรือ Document AI ไม่สามารถนำมา Customize หรือ Fine-tune ให้เข้ากับเอกสารใหม่ๆ ของแต่ละองค์กรได้

3) Abbyy FineReader & FlexiCapture

Abbyy FineReader เป็นซอฟต์แวร์ OCR suite จาก Abbyy ที่สามารถแปลงข้อมูลตัวหนังสือจาก PDF ไปเป็นตัวอักษร และรองรับภาษาไทย นอกจากนี้ยังมีฟีเจอร์อีกหลายอย่างที่ช่วยในการจัดการเอกสารอิเล็กทรอนิกส์

ข้อดี

  • รองรับภาษาไทย
  • ฟีเจอร์ที่รองรับการจัดการเอกสารอิเล็กทรอนิกส์  เช่น User Interface ที่ดูง่าย และการเปรียบเทียบเอกสาร 
  • มีให้บริการติดตั้งแบบ On-premise

ข้อจำกัด

  • License มีราคาแพง 
  • ความแม่นยำในการอ่านเอกสารไม่สูงมากนัก ถึงแม้ว่าจะเป็นรูปแบบ text ธรรมดาทั่วไป
  • ไม่สามารถรองรับเอกสารที่มีลักษณะเป็นโครงสร้าง
  • ไม่สามารถ Customize หรือ Re-train ให้เข้ากับชุดเอกสารของแต่ละธุรกิจได้

Abbyy มีผลิตภัณฑ์ซอฟต์แวร์ที่สามารถทำ OCR ได้อีกหนึ่งตัว นั่นคือ Abbyy FlexiCapture โดยเน้นไปที่ Intelligent Document Processing ทั้งกระบวนการตั้งแต่การแยกแยะเอกสาร การเชื่อมต่อกับระบบอย่าง ERP และการจัดการสิทธิ์ในการทำงาน ทำให้มีครบทั้งโซลูชันสำหรับการจัดการเอกสารทั้ง Workflow และรองรับภาษาไทยแต่ความแม่นยำโดยทั่วไปต่ำกว่า Google Vision OCR นอกจากนี้ราคาของ Abbyy FlexiCapture ก็ยังค่อนข้างแพง ในขณะที่รองรับได้แค่เอกสารที่มีลักษณะเป็นเทมเพลตเท่านั้น และวิธีการติดตั้งก็ค่อนข้างยุ่งยากอีกด้วย

4) PDF Converter หรือ PDF Copy

หลายคนอาจเคยมีประสบการณ์ Copy-paste ตัว text จาก PDF ได้โดยไม่เห็นต้องใช้โปรแกรม OCR อะไรเป็นพิเศษ จึงสงสัยว่าทำไมต้องใช้โซลูชันเหล่านี้แทนที่จะคัดลอกโดยตรง ก่อนอื่นต้องขอแยกประเภทของ PDF ออก เป็น 2 ประเภท ได้แก่

  1. Real PDF คือ PDF ที่ถูกสร้างมาแบบดิจิทัล (Digitally Created) จากต้นทาง เช่น Microsoft Word ซึ่งสามารถทำหมายเหตุประกอบ และทำ Highlight ขีดเส้นใต้ข้อความ (Annotate) รวมถึงค้นหาคำในนั้นได้ ซึ่ง PDF ประเภทนี้สามารถทำการ Copy-paste ตัวหนังสือจาก PDF ไปที่อื่นได้ แต่ก็มักจะติดปัญหาโดยเฉพาะกับภาษาไทยที่จะมีเรื่อง encoding เข้ามาทำให้การเรียงพยัญชนะ และสระเกิดความผิดเพี้ยนตามภาพประกอบด้านล่าง
ภาพประกอบ#1 :การเรียงพยัญชนะ และสระที่ไม่ถูกต้อง
ภาพประกอบ#2 :การเรียงพยัญชนะ และสระที่ไม่ถูกต้อง
  1. Scanned PDF คือ PDF ที่ได้มาจากการสแกนเอกสารเป็นรูปภาพ PDF ลักษณะนี้ต้องใช้โปรแกรม OCR ในการแปลงจากรูปตัวหนังสือให้เป็นข้อความเท่านั้น

5) Free online OCR

หากทำการค้นหาใน Google เราสามารถเจอโปรแกรม OCR ภาษาไทยที่ให้บริการฟรีกันอยู่หลายเจ้า ซึ่งวัตถุประสงค์ของการใช้งานโปรแกรม OCR ฟรีนั้นเหมาะแค่กับการใช้งานแบบส่วนบุคคลที่บ้านในการอ่าน และดึงข้อมูลจากเอกสารเพียงไม่กี่หน้าเท่านั้น

ข้อดี

  • ใช้งานได้ฟรี และใช้งานง่ายผ่านทางเว็บ Browser

ข้อจำกัด

  • ความแม่นยำต่ำ 
  • สามารถอ่านได้เฉพาะ Raw text
  • ไม่สามารถทำเอกสารที่มีโครงสร้างให้ได้ผลที่มีโครงสร้างได้
  • ไม่สามารถนำไป Integrate หรือเชื่อมต่อกับซอฟต์แวร์ในกระบวนการทำ    งานอื่นๆ
  • ไม่สามารถติดตั้ง On-premise หรือพัฒนา Customize เพิ่มเติมได้

6) Tesseract

ถ้าพูดถึงโปรแกรม OCR library ภาษาไทยที่สามารถนำมาใช้ได้ฟรี และติดตั้ง On-premise พร้อมกับ Software Application ที่ต้องการใช้กับโปรแกรม OCR อื่นได้ คงหนีไม่พ้นโปรแกรม Tesseract OCR library

Tesseract เป็นโค้ดและโมเดล OCR ที่เริ่มพัฒนามาจากภายใน Hewlett Packard ซึ่งสุดท้ายได้มีการปล่อยเป็น Open-Source และได้รับการสปอนเซอร์จาก Google ตั้งแต่ปี 2006 ในลักษณะ Open-source แม้จะมีข้อดีมากมายจากที่กล่าวถึงไปแล้ว แต่จุดอ่อนของ Tesseract อย่างความแม่นยำ ทำให้ยากในการนำไปใช้หรือพัฒนาต่อ และทำได้แค่ OCR เท่านั้น แต่ไม่มีโค้ดหรือ AI ที่เข้าใจ Structured Document เหมาะกับงานวิจัย หรือการศึกษาที่นักเรียนสามารถนำไปฝึกใช้ได้

ข้อดี

  • สามารถใช้งานได้ฟรี เนื่องจากเป็น Open-source
  • รองรับภาษาไทย

ข้อจำกัด

  • ความแม่นยำ
  • ยากในการที่จะนำไปพัฒนาต่อ 
  • ไม่สามารถเข้าใจเอกสารที่เป็น Structure ได้

7) NECTEC Thai OCR

ทาง NECTEC เองได้มีผลงานการพัฒนาซอฟต์แวร์ OCR มาอย่างยาวนาน ตั้งแต่เวอร์ชันที่ใช้ในเชิงพาณิชย์โดยการติดตั้งบน Desktop จนปัจจุบันก็มี OCR as a service ให้ทดลองใช้ได้บนแพลตฟอร์ม AI for Thai ซึ่งก็มี OCR โดยบริษัทไทยเจ้าอื่นให้ทดลองใช้ด้วย การนำ OCR service ไปใช้จริงอาจเป็นส่วนที่ไม่สะดวกที่สุดด้วยการขาดซัพพอร์ตสำหรับการนำไปใช้จริงในเชิง commercial

ซอฟต์แวร์ OCR ของ AI GEN แตกต่างจากเจ้าอื่นอย่างไร

aiScript เป็น AI suite ที่รวบรวมสิ่งที่จำเป็นต่อการประมวลผลรูปเอกสารโดยมี AI อยู่เบื้องหลังการทำงานทั้งหมด นอกจาก OCR ที่ใช้โมเดล AI ที่เทรนมาจากประเภทของเอกสารและ font ที่หลากหลายซึ่งทำให้ความแม่นยำสูง (เช่น เอกสารหนังสือราชการที่สแกนมาชัดเจนมีผลความแม่นยำอยู่ที่ 99%) ซึ่ง aiScript ยังมีโมเดล AI ที่รู้จักเอกสารประเภทต่างๆอย่างครอบคลุม ไม่ว่าจะเป็นเอกสารที่มีรูปแบบตายตัว (template) เช่น บัตรประชาชน ใบขับขี่ สมุดจดทะเบียนรถยนต์ หน้าสมุดบัญชีธนาคาร เอกสารราชการอย่างใบมรณบัตร หรือ เอกสารที่ไม่มีรูปแบบตายตัว (non-template) เช่น ใบแจ้งหนี้ และใบเสร็จรับเงิน ทำให้สามารถดึงข้อมูลจากแต่ละชนิดเอกสารได้ตามที่ต้องการโดยรู้ความหมายของข้อมูลว่าเป็น เลขที่บัตร หรือ ชื่อ-นามสกุล หรือ วันที่หมดอายุ หรือเป็นจำนวนเงินรวม (Total amount) แล้วใส่ในตารางที่เป็น structured format ที่คนหรือซอฟต์แวร์อื่นๆสามารถนำไปใช้ต่อได้ง่าย

นอกจากนี้บริการ OCR เจ้าต่าง ๆ ในไทยยังมีปัญหาที่ไม่รองรับหากมีหลายภาพเอกสารส่งมาในรูปเดียวกันกับเอกสารที่ต้องการ เช่น มีทะเบียนบ้านปนมาในสแกนรูปบัตรประชาชน รวมทั้งไม่รองรับการถ่ายภาพในแนวที่ไม่ใช่แนวตั้ง ส่วนลายน้ำบนกระดาษที่ซ้อนทับตัวหนังสือ ซึ่งมีอยู่ในหลายชนิดเอกสาร เช่น ใบมรณบัตร กรมธรรมรถยนต์ หรือเอกสารราชการ ก็มักจะทำให้มีปัญหาเรื่องความแม่นยำ แม้แต่ปั๊มตรายางบนกระดาษ aiScript ก็สามารถตรวจหา และทำให้ลดผลกระทบต่อการอ่าน OCR บนหน้ากระดาษได้

ความสามารถของโปรแกรม aiScript อย่างยังรวมไปถึงการอ่านข้อมูลจากรูปตารางในเอกสารไปลง Spreadsheet ได้ แยกแยะแต่ละประเภทของเอกสาร และเทียบความแตกต่างระหว่างรูปเอกสาร ทำให้การทำงานกับรูปภาพเอกสารในธุรกิจมีความครบวงจร ตอบโจทย์กับทุกธุรกิจ การใช้งานสามารถเรียกใช้งานผ่าน API ได้อย่างง่ายดาย ทำให้การนำไปเชื่อมต่อกับ Business process software อื่นเป็นเรื่องง่าย และค่าใช้จ่ายต่ำ หากต้องการติดตั้งแบบ On-premise ก็สามารถทำได้ อีกทั้งสามารถ Customize model ให้เข้ากับเอกสารจำเพาะขององค์กร และเทรนให้มีความแม่นยำขึ้นได้อยู่เสมอ

เลือกใช้ซอฟต์แวร์ OCR ที่ตอบโจทย์ธุรกิ

  1. การดึงข้อมูล

โปรแกรม OCR นี้จะแปลงไฟล์ PDF ให้เป็นเอกสารที่สามารถแก้ไขได้อย่างง่ายดาย รองรับภาษาไทย สามารถช่วยอำนวยความสะดวกในการนำข้อมูลจำเป็นไปใช้ยืนยันตัวตนในระบบ เช่น เลขบัตรประชาชน และชื่อ-นามสกุล ซึ่งโปรแกรม OCR ที่ดี ควรมีความสามารถในการตรวจเช็กเอกสารได้อย่างแม่นยำ และสามารถบ่งชี้ความผิดปกติตามชนิดและฟิลด์ของเอกสารได้ เช่น แจ้งเตือนเมื่อเลขบัตรประชาชนไม่ครบ 13 หลัก เป็นต้น

  1. การพัฒนาบริการเพิ่มเติม และงบประมาณที่ใช้

ในกรณีที่เอกสารของคุณ มีรูปแบบเฉพาะ ซึ่ง AI-powered OCR ยังไม่มีเอกสารรูปแบบนี้ในระบบพร้อมสำหรับใช้งาน กรณีนี้จะต้องมีการพัฒนาเพิ่มเติมเสียก่อน จึงต้องใช้เวลา (Lead time) และมีค่าใช้จ่าย เพิ่มเติม และถ้าหากต้องการหลายฟอร์ม ก็จะทำให้ค่าใช้จ่ายในส่วนนี้เพิ่มขึ้นแบบทวีคูณ ซึ่งซอฟต์แวร์ระบบ OCR ที่ดีควรจะมี Turn-around time ที่รวดเร็ว ค่าใช้จ่ายที่สมเหตุสมผล หรือมีทางเลือกให้สามารถเทรนแบบฟอร์มที่ต้องการได้เอง แต่ผู้ให้บริการ OCR บางรายก็ยังไม่สามารถมอบบริการในส่วนนี้ได้

  1. นำไปใช้ร่วมกับระบบอื่นได้สะดวกหรือไม่

ซอฟต์แวร์ระบบ OCR ที่ดี ควรสามารถนำไปใช้ร่วมกับระบบอื่นที่อยู่ในกระบวนการทางธุรกิจได้ง่าย การใช้บริการผ่าน API จะสามารถทำให้การเรียกใช้งาน OCR นำไปใช้ได้กับหลายระบบพร้อม ๆ กัน ไม่ว่าจะเป็น Mobile app, Web app หรือ ระบบ CRM นอกจากนี้ ยังต้องควรทดสอบโดยการใช้กับกระบวนการ Onboarding ตั้งแต่แรก รวมถึงการนำ API ไปทดลองใช้ใน UAT environment ที่จะไม่กระทบกับระบบจริง (production) และสุดท้ายคือการนำไปเชื่อมต่อใน Production ด้วย Service Level ของการใช้งานจริง

  1. On-premise vs. On-cloud

ด้วยกฎหมายข้อมูลส่วนบุคคลที่เคร่งครัด บางธุรกิจอาจยังมีความไม่สบายใจในการส่งออกรูปภาพเอกสาร หรือข้อมูลส่วนบุคคลออกไปยัง Cloud ทำให้ On-premise ยังเป็นทางเลือกที่ยังต้องมีให้บริการอยู่ ซอฟต์แวร์ OCR ที่ดีควรมีความสามารถในการนำไปใช้งาน On-premise ได้โดยที่ทางธุรกิจสามารถเป็นผู้จัดซื้อฮาร์ดแวร์ได้เองด้วย

  1. การสนับสนุนและบริการ

การมีคนช่วยสนับสนุน หรือซัพพอร์ตเวลาเกิดปัญหา หรือ customize โซลูชันให้เข้ากับธุรกิจของเรา เป็นสิ่งที่หลายธุรกิจให้ความสำคัญเป็นอย่างมาก นอกจากนี้ผู้ให้บริการโปรแกรม OCR ของคนไทย หรือมีสำนักงานอยู่ในไทยเองนั้น จะมีความใกล้ชิดกับธุรกิจทำให้ธุรกิจจะได้รับการซัพพอร์ตได้อย่างรวดเร็ว และมีโอกาสรับฟัง Feedback จากลูกค้าอย่างใกล้ชิด เพื่อนำไปปรับปรุงผลิตภัณฑ์ให้ดียิ่งขึ้น

  1. ฟีเจอร์เสริม และ Roadmap ในการพัฒนาระบบ

ซอฟต์แวร์ OCR ที่ดีอาจมีตัวช่วยเรื่องการทำงาน ไม่เพียงแค่จัดการเรื่อง OCR ให้เท่านั้น แต่ยังมีตัวช่วยในการตัดสินใจ เช่น Confidence score ที่บ่งบอกความน่าจะเป็นในความแม่นยำของผลลัพธ์นั้น อาจมีการทำ Business logic จากผลการดึงข้อมูลโดยอัตโนมัติได้ เช่น การตรวจเช็คว่าชื่อบนรูปบัตรประชาชนตรงกับในรูปของแบบฟอร์มเอกสารหรือไม่ หรือสามารถกำหนดเงื่อนไขของ Straight-through processing ได้ผ่านการตั้งเงื่อนไขจากผลของ OCR และ Confidence score นอกจากนี้ผู้ให้บริการ OCR ที่ดีควรมีการเสริมสร้างความแข็งแกร่งของ Product หรือ Re-train และพัฒนาโมเดล AI อยู่เสมอ และมี Roadmap ที่ทำให้ซอฟต์แวร์ที่ธุรกิจได้ลงทุนนำไปใช้งานนั้นมีความสามารถที่ดีขึ้นได้เรื่อย ๆ เพื่อให้เกิดความคุ้มค่าในระยะยาวกับธุรกิจ

  1. ภาพรวมของธุรกิจ

แน่นอนว่าสิ่งที่สำคัญสำหรับการเลือกใช้ซอฟต์แวร์ OCR ส่วนหนึ่งคือต้นทุนในการใช้งาน ราคาที่ถูกอาจไม่ใช่คำตอบสุดท้ายเสมอไป หากถ้าพิจารณาจากความแม่นยำ หรือการใช้งานที่ไม่ตอบโจทย์ธุรกิจ สุดท้ายอาจทำให้ภาพรวมการนำไปใช้นั้นมีต้นทุนสูงกว่าค่าใช้จ่าย OCR ชุดซอฟต์แวร์ระบบ OCR ที่มีคุณภาพอาจทำให้ลดปริมาณงานลงได้จริง ทำ Straight-through processing ของกระบวนการธุรกิจได้มากกว่า ทำให้ความคุ้มค่าของการใช้งานสูงกว่าแม้ราคาของระบบ OCR จะแพงกว่าก็ตาม นอกจากนี้ควรคำนึงถึงคุณค่าของข้อมูลที่ดึงออกมาว่าอาจมีค่าต่อธุรกิจอีกมาก จากเดิมข้อมูลเหล่านี้อยู่ในรูปแบบ Pixel ที่ไม่สามารถนำไปวิเคราะห์ต่อได้ การทำ OCR จะทำให้ข้อมูลจากเอกสารสามารถถูกนำมาอยู่ในรูปแบบที่ใช้งานต่อได้ในยุคที่ข้อมูลเป็นเหมือนทองหรือน้ำมัน คุณค่าจากข้อมูลที่ได้อาจมากกว่าต้นทุนในการทำ OCR ก็เป็นได้

ในขณะเดียวกันความแม่นยำในการแปลงแต่ละตัวอักษรก็สำคัญแต่เป็นแค่มิติการใช้งานเพียงด้านเดียว เช่นเดียวกับเรื่องราคา ควรพิจารณาให้รอบด้านก่อนเลือกซอฟต์แวร์ระบบ OCR ที่จะนำมาใช้ในธุรกิจ

หากคิดว่าโซลูชัน AI-Powered OCR คือทางออกที่ดีที่สุดในแง่ของกระบวนการประมวลผลและเก็บข้อมูลของธุรกิจคุณ และต้องการที่ปรึกษา รวมถึงพาร์ทเนอร์คู่คิด เริ่มปรึกษาพวกเรา AI GEN (ไอเจ็น) ได้ที่นี่เลยค่ะ

 

AI GEN Live chat