首先關注一個核心(xin)問題:什么(me)場景下的OCR識(shi)別需求分別對應(ying)選擇什么(me)型號智能相機,以及是否需要(yao)深(shen)度學習(xi)?
一、字符識(shi)別
對(dui)于(yu)一些(xie)產線產品位置固定,OCR 特征清晰明顯,對(dui)比度高、背(bei)景簡單的字符(fu),可 以通過傳統方式(shi)即閾值(zhi)分割(ge)的形式(shi)進行讀(du)取的需求,相機(ji)字符(fu)識(shi)別自(zi)帶的模型(xing)可以應對(dui) 現(xian)場(chang)(chang)如點陣(zhen)、刻蝕、壓印出來的字符(fu)。自(zi)帶的模型(xing)內部(bu)已經訓練(lian)了幾百萬(wan)張(zhang)樣本,基本涵蓋了絕大部(bu)分應用場(chang)(chang)景。
二、特征匹配(位置(zhi)修正(zheng))+字符識別
對于一些產品(pin)在視野內可(ke)能位(wei)置會變(bian)動、產品(pin)位(wei)置不(bu)固定但前景(jing)(jing)和(he)背景(jing)(jing)灰度差較大、干擾較少(shao)的實際場景(jing)(jing),可(ke)以(yi)開啟位(wei)置修正對字符識(shi)別進行輔助定位(wei),來保(bao)證產品(pin)移(yi)動、旋轉(zhuan)等各(ge)種情況下都可(ke)以(yi)定位(wei)到要識(shi)別的字符。
注:開啟位置(zhi)修正后,需保證模板區(qu)域始終在相(xiang)機(ji)視(shi)野(ye)內,否則特征(zheng)匹配(pei)不到會持續NG。
三、DL 字符識別
在一些字(zi)(zi)符(fu)形態大小不(bu)統一,對比度(du)低,背景(jing)(jing)存在干擾,字(zi)(zi)符(fu)粘連,畸變等(deng)場景(jing)(jing), 傳統方法效(xiao)果一般(ban),這個時候可(ke)以(yi)用到(dao)深度(du)學習,在常見行(xing)業(ye)(ye)(ye)如,食(shi)藥品包裝,電子行(xing)業(ye)(ye)(ye),煙草行(xing)業(ye)(ye)(ye)薄膜,半導(dao)體晶源等(deng)等(deng)已經實(shi)現全行(xing)業(ye)(ye)(ye)覆蓋,不(bu)需要進行(xing)過多的(de)模型訓練,就可(ke)以(yi)實(shi)現字(zi)(zi)符(fu)的(de)高效(xiao)識別(bie)檢測,準確率基本在三個九以(yi)上。
四、DL字符定位+DL字符識別
在(zai)很多實際的OCR檢(jian)測需(xu)(xu)求中,字符位置(zhi)不固定(ding)(ding),字符大小不統一(yi),甚至一(yi)些需(xu)(xu)求僅檢(jian)測視(shi)野內(nei)某個特定(ding)(ding)區域內(nei)的字符,應(ying)對這類情(qing)況,往往需(xu)(xu)要深度學(xue)習(xi)定(ding)(ding)位和深度學(xue)習(xi)識別搭(da)配起來使用,提高(gao)準確率(lv)和穩定(ding)(ding)性達到預期效(xiao)果。
食品行業(ye)噴墨會(hui)導致字(zi)(zi)符大小(xiao)、深(shen)(shen)淺、形態和位(wei)置都會(hui)有變化,傳(chuan)統方法無法準確定(ding)位(wei)到字(zi)(zi)符,引入深(shen)(shen)度學習定(ding)位(wei)和深(shen)(shen)度學習識別(bie)有效解決(jue)難題。
面對僅檢測(ce)(ce)紅框內字(zi)符(出界即NG)的實際需(xu)求,傳統算法模塊無法實現檢測(ce)(ce)需(xu)求,引入深度學(xue)習定(ding)(ding)位進(jin)行輔助,定(ding)(ding)位框框選(xuan)目標區域,搭(da)配出界過濾(lv)使(shi)能(neng)完美解決(jue)應用難(nan)點。
外包裝(zhuang)行業需要對(dui)箱體噴墨進行OCR識(shi)別(bie),字符位(wei)數、長短、大(da)小、位(wei)置及拍照(zhao)距離都存在(zai)變化,且應(ying)對(dui)字符分段、噴墨深淺不(bu)一、存在(zai)劃(hua)痕等干擾,深度(du)學習都可以(yi)穩(wen)定定位(wei)并識(shi)別(bie)。
OCR識別(bie)仍然是(shi)智能相(xiang)機的主要(yao)應(ying)用方向(xiang)(xiang)之(zhi)一,關于OCR識別(bie)的優化和更新也(ye)是(shi)智能相(xiang)機的重點迭代方向(xiang)(xiang),智能相(xiang)機會結合市場需(xu)求和建議(yi)不斷優化算(suan)法庫以適應(ying)并解決愈(yu)發多樣性的檢(jian)測場景和任務
廣州艾韋迅科技是海康威視HIKVISION旗下的海康機器人HikRobot海康智能讀碼器/工業相機經銷商,供應海康掃描槍ID2000、ID3000、ID5000、ID6000等系列全部型號,海康威視HIKVISION讀碼器同時為 為電子、物流、FPD顯示屏、半導體、汽車制造等領域提供專業機器視覺解決方案,海康工業讀碼器助(zhu)力用戶快速準確實現(xian)工(gong)業自動化。