OCR มีกี่ประเภท และทำงานอย่างไร?
เพื่อตอบสนองกับไลฟ์สไตล์ของผู้คนและเทรนด์โลก ที่ต้องการรูปแบบการทำงานที่ให้ประสิทธิภาพสูงสุด และใช้ทรัพยากรให้น้อยที่สุด จึงมีการพัฒนาเทคโนโลยีใหม่ ๆ ขึ้นมาอย่างต่อเนื่อง เพื่อให้สามารถนำมาขับเคลื่อนกับการทำงานได้อย่างมีประสิทธิภาพ ซึ่งหนึ่งในเทคโนโลยีที่ถูกนำมาปรับใช้และเป็นตัวช่วยสำคัญให้กับการทำงานยุคใหม่ คงจะไม่พ้นระบบ OCR หรือ Optical Character Recognition ที่อาจเรียกได้ว่าเป็น ‘ตัวพลิกเกม’ เลยก็ว่าได้ เพราะระบบนี้สามารถเข้ามาเปลี่ยนวิธีการทำงานในยุคปัจจุบันให้เกิดประสิทธิภาพ อีกทั้งยังสะดวกและรวดเร็ว สำหรับผู้ประกอบการที่สนใจในเทคโนโลยี OCR แต่ยังไม่ทราบว่า OCR คืออะไร มีอะไรบ้างหรือมีกี่ประเภท บทความนี้ จะมาช่วยอธิบายให้รู้กันแบบครบถ้วน ติดตามได้เลย
เทคโนโลยี OCR คืออะไร?
ก่อนที่จะไปถึงประเภทของของ OCR สิ่งแรกที่ผู้ประกอบการควรทำความเข้าใจ คือภาพรวมของ OCR หรือ Optical Character Recognition ว่ามีลักษณะแบบใด สำหรับ OCR นั้น จะเป็นเทคโนโลยีที่ใช้ระบบคอมพิวเตอร์เข้ามาช่วยในการเปลี่ยนลายมือ เอกสารสแกนลายมือ และเอกสารการพิมพ์ ให้อยู่ในรูปการเข้ารหัสตัวอักษรที่ระบบคอมพิวเตอร์สามารถเข้าใจได้ ดังนั้น OCR จึงเปรียบเสมือนประตูนำทางข้อมูลที่อยู่ในรูปแบบอนาล็อก มาเปลี่ยนให้เป็นข้อมูลในรูปแบบดิจิทัล ทำให้เทคโนโลยี OCR สามารถช่วยทุ่นแรงมนุษย์ในการทำงานได้อย่างมาก
เพื่อให้ภาพชัดเจนยิ่งขึ้น ขอยกตัวอย่างในกรณีที่เราอยากเก็บข้อมูลโค้ด หรือ Serial Number ที่เป็นทั้งตัวเลขและตัวหนังสือในภาพถ่ายให้อยู่ในรูปแบบดิจิทัล ก็สามารถใช้เทคโนโลยี OCR ในการประมวลผลข้อมูลในรูปถ่ายนั้น ๆ โดยจะเป็นการดึงข้อมูลตัวอักษรออกมา และจำแนกตัวหนังสือเหล่านั้น จากนั้นจะทำการบันทึกเข้าสู่ระบบดิจิทัล อย่างไรก็ตาม ในปัจจุบันถึงแม้ว่า OCR จะทำการอ่าน และเรียนรู้ตัวหนังสือเหล่านั้น แต่ยังไม่สามารถเข้าใจความหมายด้วยตัวของมันเองได้
OCR มีกี่ประเภท?
เนื่องจากรูปแบบของตัวอักษรในโลกนี้มีมากมาย ประเภทของ OCR จึงไม่ได้มีเพียงอย่างเดียวเช่นกัน เพื่อให้ตอบโจทย์การใช้งานได้อย่างครบครัน และหากสงสัยว่า OCR มีอะไรบ้าง ก็สามารถแบ่งเป็นประเภทได้ดังต่อไปนี้
- Printed OCR: เป็นเทคโนโลยี OCR ประเภทที่นิยมแพร่หลายมากที่สุด สามารถอ่านข้อความที่พิมพ์ด้วยฟอนต์ ขนาด และรูปแบบต่าง ๆ ที่มีการใช้กันอย่างแพร่หลายในอุตสาหกรรมต่าง ๆ เช่น สิ่งพิมพ์ การธนาคาร และการศึกษา
- Handwritten OCR: ใช้เพื่อจดจำข้อความที่เขียนด้วยลายมือ แน่นอนว่าระบบประมวลผลมีความซับซ้อนกว่า Printed OCR เนื่องจากลายมือของแต่ละบุคคลมีอัตลักษณ์ที่แตกต่างกันไป อย่างไรก็ตาม ในบางอุตสาหกรรมที่ลายมือมนุษย์ยังคงมีบทบาทสำคัญ เช่น การบังคับใช้กฎหมาย การดูแลสุขภาพ และการเงิน จึงจำเป็นต้องใช้งาน OCR ประเภทนี้
- Intelligent OCR: ใช้ปัญญาประดิษฐ์และอัลกอริธึมการเรียนรู้ของเครื่องเพื่อจดจำข้อความ โดยสามารถอ่านข้อความในรูปแบบต่าง ๆ เช่น รูปภาพ PDF นิยมใช้ในอุตสาหกรรม การค้าปลีก การประกันภัย และการผลิต
- Zonal OCR: ใช้เพื่อจดจำข้อความในพื้นที่เฉพาะของเอกสาร เป็นที่นิยมใช้ในการประมวลผลแบบฟอร์มและการป้อนข้อมูล
- Magnetic Ink Character Recognition (MICR): ใช้เพื่อจดจำอักขระพิเศษที่พิมพ์ด้วยหมึกแม่เหล็ก เช่น อักขระที่พบในเช็ค มีการใช้กันอย่างแพร่หลายในอุตสาหกรรมการธนาคาร
ดังนั้นจากข้อมูลข้างต้น จึงอาจตอบคำถามว่า OCR มีกี่ประเภทได้พอสังเขป อย่างไรก็ตาม สามารถแยกย่อยลงไปได้ละเอียดกว่านี้เช่นกัน
ขั้นตอนการทำงานของเทคโนโลยี OCR
เมื่อได้ทราบไปแล้วว่า OCR มีอะไรบ้าง และถึงแม้แต่ละประเภทของ OCR จะมีจุดประสงค์การใช้งานที่แตกต่างกัน แต่ในด้านระบบการทำงาน OCR ทุกประเภทตั้งอยู่บนแกนหลักเดียวกัน ซึ่งหนึ่งในความท้าทายที่สุดของ OCR ที่สามารถยกตัวอย่างมาให้เห็นภาพก็คือในเรื่องของตัวอักษร เช่น ตัวอักษร A ที่ถึงแม้แต่ละแหล่งที่มาจะเป็น A เหมือนกัน แต่ก็มีความแตกต่างกันในรายละเอียด ไม่ว่าจะเป็นลายมือหรือการใช้ฟอนท์ที่ใช้กันคนละแบบ
ดังนั้น โดยทั่วไปแล้ว การทำงานของ OCR เพื่อแก้ปัญหาดังกล่าวจึงจะมีอยู่ด้วยกัน 2 รูปแบบ คือ Pattern Recognition และ Feature Detection ซึ่งมีรายละเอียดดังต่อไปนี้
Pattern Recognition
ถ้าทุกคนเขียนตัวอักษร A เหมือนกันหมด คอมพิวเตอร์จะสามารถจำแนกตัวอักษร A ได้ง่ายมากยิ่งขึ้น แค่ทำการเปรียบเทียบรูปที่ถูกแสกนเข้ามา กับตัวหนังสือ A ที่เก็บเอาไว้ในระบบ และถ้าทั้งสองอย่างแมทช์กัน ก็จะสามารถระบุได้ว่าตัวอักษรนี้คือตัวอักษร A
แต่เราจะทำให้ทุกคนเขียนตัวหนังสือเหมือนกันได้อย่างไร?
ย้อนกลับไปเมื่อปีค.ศ. 1960 มีการพัฒนาฟอนท์รูปแบบพิเศษขึ้นมา เรียกว่า OCR-A ที่ใช้ในการทำธุรกรรมทางการเงิน โดยทุกตัวอักษรจะมีความกว้างเท่ากัน ออกแบบลายเส้นของตัวอักษรมาเป็นอย่างดี เพื่อสามารถแยกความแตกต่างจากตัวอักษรได้ง่ายขึ้น ธนบัตรหรือเช็คที่ถูกพิมพ์ออกมาจะใช้ฟอนท์พิเศษนี้ทั้งหมด และโปรแกรม OCR ได้ถูกออกแบบมาเพื่อจำแนกตัวอักษรประเภทนี้เช่นกัน โดยออกแบบฟอนท์ให้เป็นรูปแบบมาตรฐาน ทำให้โปรแกรม OCR สามารถจำแนกตัวอักษรได้โดยง่าย แต่ปัญหาที่สำคัญอย่างหนึ่งคือ ตัวอักษรส่วนใหญ่ในโลกไม่ได้ใช้ฟอนท์ OCR-A ดังนั้นขั้นตอนถัดไปจึงเป็นเรื่องของการสอนให้โปรแกรม OCR สามารถจำแนกฟอนท์ตัวอักษรทั่วไปได้มากขึ้น เช่น ฟอนท์ Time, Helvetica, Courier แต่แน่นอนว่ายังไม่ครอบคลุมทุกฟอนท์ในโลกนี้
Feature Detection
หรือมีอีกชื่อหนึ่งว่า Intelligent Character Recognition (ICR) เรียกได้ว่ารูปแบบการทำงานนี้สามารถเข้ามาช่วยแก้ปัญหาของ Pattern Recognition ได้ค่อนข้างตรงจุด เพราะจะช่วยให้จำแนกตัวหนังสือได้มากกว่า
Feature Detection มาพร้อมกับวิธีคิด จากการเริ่มตั้งคำถามว่าถ้าเราเป็นโปรแกรม OCR ที่ต้องจำแนกตัวหนังสือที่เป็นลายมือที่มีความหลากหลาย เราจะเลือกตัวหนังสือ A ออกมาได้อย่างไร ถึงแม้วิธีการเขียนจะแตกต่างกันเพียงเล็กน้อย คำตอบก็คือ ในอักษรตัว A ถ้าเราเห็นเส้นตรงเฉียงสองเส้นที่มาประกบกันตรงกลางด้านบนสุด และมีเส้นแนวนอนตรงกลางระหว่างเส้นตรงเฉียงสองเส้น โดยการใช้กฎการทำงานนี้ เพื่อจำแนกแต่ละองค์ประกอบของตัวหนังสือ (เส้นด้านข้าง, เส้นขีดคร่อม และอื่น ๆ) ก็จะทำให้สามารถจำแนกได้ว่าตัวอักษรนี้คือตัวอักษร A ไม่ว่าจะเป็นฟอนท์รูปแบบไหนก็ตาม แทนที่จะใช้วิธีการจำแนกแพทเทิร์นตัวอักษร A แบบสมบูรณ์เหมือน Pattern Recognition
การใช้ Feature Detection ก็เพื่อให้สามารถจัดการกับเอกสารได้หลากหลายประเภทมากขึ้น อีกทั้งผู้ให้บริการเทคโนโลยี OCR เริ่มมีการพัฒนาระบบที่มีความเฉพาะเจาะจงมากยิ่งขึ้น เช่นระบบที่สามารถประมวลผลรูปภาพแบบพิเศษ เพื่อเพิ่มความแม่นยำในการจำแนกอักขระ หรือตัวอักษร รวมถึงมีการรวบรวมหลายเทคนิคไว้ด้วยกัน ตัวอย่างเช่น ใช้กฎเกณฑ์ในการทำธุรกิจบางอย่าง มาตรฐานคำศัพท์ หรือข้อมูลที่ประกอบด้วยรูปภาพสี เหล่านี้เป็นการใช้กลยุทธ์รวมหลาย ๆ เทคนิค เพื่อ Optimization เข้าไว้ด้วยกัน ซึ่งเรียกว่า “application-oriented OCR” หรือ “customized OCR” มักจะประยุกต์ใช้กับการอ่านข้อมูลนามบัตร ใบเสร็จ/ใบกำกับภาษี รวมถึงบัตรประจำตัวประชาชน
ถือได้ว่าเทคโนโลยี OCR สามารถประยุกต์ใช้ได้ทั้งในชีวิตประจำวัน และในภาคธุรกิจ เป็นอีกหนึ่งเทคโนโลยีที่ช่วยอำนวยความสะดวกและทุ่นแรงในการทำงาน เหมือนมีผู้ช่วยในการจำแนกตัวหนังสือ และประเภทของเอกสาร รวมถึงการแปลภาษาให้อีกด้วย ที่สำคัญสามารถช่วยเพิ่มประสิทธิภาพในการทำงาน และลดความผิดพลาดของการกรอกข้อมูล รวมถึงทำให้มนุษย์มีเวลาที่จะสร้างสรรค์ผลงานด้านอื่น ๆ ได้มากยิ่งขึ้นอีกด้วย
ดึงข้อมูลจากไฟล์ได้แบบอัตโนมัติด้วย aiScript OCR
ถึงตรงนี้ เชื่อว่าผู้ประกอบการน่าจะได้ทราบแล้วว่า OCR มีกี่ประเภท OCR มีอะไรบ้าง ประเภทของ OCR รวมถึงการทำงานของ OCRR ซึ่งถ้าหากผู้ประกอบการสนใจต้องการนำเทคโนโลยีนี้ไปประยุกต์ใช้ให้เกิดประโยชน์กับธุรกิจของตัวเอง AIGEN ได้พัฒนา aiScript บริการ AI-Powered OCR โซลูชันสำหรับประมวลผลเอกสารได้แบบอัตโนมัติ ที่ตอบโจทย์ธุรกิจในการจัดการข้อมูลจากเอกสาร ลดภาระพนักงานจากการทำงานแบบแมนนวล ยกระดับขั้นตอนการทำงานให้เป็นอัตโนมัติมากยิ่งขึ้น มาพร้อมกับฟีเจอร์สำคัญที่รองรับทุกความต้องการของธุรกิจยุคใหม่ อีกทั้งรองรับเอกสารทั้งที่มีรูปแบบตายตัว ไม่ว่าจะเป็นบัตรประชาชน ใบขับขี่ สมุดบัญชีธนาคารและเอกสารที่ไม่ได้มีรูปแบบแน่นอนตายตัว เช่น Invoice หรือใบแจ้งหนี้ เอกสารการเคลมประกัน ใบสมัคร รวมถึงเอกสารเฉพาะของธุรกิจได้มากกว่า 15 ประเภท โดยที่ธุรกิจสามารถทดลองใช้งาน aiScript OCR ได้ฟรี! ที่ Link หรือสนใจปรึกษาผู้เชี่ยวชาญของเราเกี่ยวกับการนำ OCR ไปใช้กับธุรกิจได้ที่นี่
ทีมงานผู้เชี่ยวชาญด้าน AI อัจฉริยะ พร้อมช่วยขับเคลื่อนการทำงานของธุรกิจ มีประสบการณ์ให้บริการโซลูชัน AI เพื่อองค์กรระดับประเทศมากมาย