什么是OCR文字識別技術
OCR英文全稱是Optical Character Recognition,中文叫做光學字符識別。它是利用光學技術和計算機技術把印在或寫在紙上的文字讀取出來,并轉換成一種計算機能夠接受、人又可以理解的格式。
OCR字符識別技術的應用場景
OCR字符在線識別技術廣泛應用于銀行票據、文獻資料錄入和處理領域。適合于銀行、稅務等行業大量票據表格的自動掃描識別及長期存儲。在機器視覺領域,OCR同樣具有多方面的應用,通過工業相機、工業鏡頭拍攝文字圖像,運用機器視覺軟件進行相應處理以獲取我們需要的信息,常見的應用有:
1、儀器儀表上的數據讀取,如居民生活中得到水表、氣表、電表的數值讀取;
2、產品的日期、批號讀取,獲得產品的過期信息及可追溯信息;
3、智能交通的車牌識別,獲取違章車輛的信息。
點擊圖片查看視頻: 點擊圖片或文字查看視頻:
點擊圖片或者文字查看視頻:
機器視覺方面的OCR應用
1、檢測條碼/字符印刷缺陷、完整度
2、檢測條碼/字符的對錯、是否漏印
3、檢測物體的方向是否正確
4、靜態或動態檢測
5、OK/NG產品系統輸出相應控制信號。
OCR文字識別常見應用
OCR技術確實也在改變著我們的生活:比如一個手機APP就能幫忙掃描名片、身份證,并識別出里面的信息;汽車進入停車場、收費站都不需要人工登記了,都是用車牌識別技術;我們看書時看到不懂的題,拿個手機一掃,APP就能在網上幫你找到這題的答案。這都是于基于OCR技術的應用。
OCR技術的發展
在一些簡單環境下OCR的準確度已經比較高了(比如電子文檔),但是在一些復雜環境下的字符識別,在當今還沒有人敢說自己能做的很好。現在大家都很少會把目光還放在如何對電子文檔的文字識別該怎么進一步提高準確率了,因為他們把目光放在更有挑戰性的領域。OCR傳統方法在應對復雜圖文場景的文字識別顯得力不從心,越來越多人把精力都放在研究如何把文字在復雜場景讀出來,并且讀得準確作為研究課題,用學界術語來說,就是場景文本識別(文字檢測+文字識別)。