艾塔科技(大連)有限公司
更多

ATA TECHNOLOGY (DALIAN) CO., LTD.

首页 >> 新聞動態 >>行業資訊 >> 非結構化數據的獲取——OCR
详细内容

非結構化數據的獲取——OCR

时间:2022-04-15     【转载】

數據獲取的相關科技—光學字元識別符


在應用過程中,RPA通常在第一個數據獲取環節就會遇到難題,如給機器人輸入的是一份掃描件或者一張圖片。 如何來處理? 這就需要光學字元識別(OCR)科技。


光學字元識別符

所謂光學字元識別(Optical Character Recognition,OCR)科技,是指基於電子設備(如掃描儀或數位相機)掃描件的文字,通過OCR科技檢測掃描件上暗、亮的模式以確定文字的形狀,然後用字元識別方法將形狀翻譯成文字的過程。 整個過程是首先需要對紙質文字資料進行掃描,然後對影像檔案進行分析處理,最後獲取文字及版面資訊。


由於企業員工在辦理業務過程中,仍然需要與真實的物理世界打交道,小到發票識別、檔案識別、銀行卡和身份證的識別,大到廣告、海報的識別,而RPA卻不能直接讀取這些影像資訊,囙此需要借助OCR科技。 另外,如果遇到需要識別遠程桌面或無法獲取本地案頭的欄位的情况,也需要借助OCR科技來識別。 例如,財務領域的自動化應用中,經常需要利用OCR科技對發票進行識別和處理。


傳統的OCR科技還需靠人工來判斷和校正,特別是對於手寫文字、印章、套打、壓蓋等,識別率不高。 雖然OCR科技已經發展多年,也在金融機構的票據中心、單證中心、財務共亯中心得到廣泛使用,但直到今天,人工介入的環節還是不可避免。 人工介入的環節如何更少,人工介入後的處理如何更便捷,才是自動化領域專家需要考慮的問題。


111.png

在自動化領域,我們主要通過兩個方向來解决OCR的識別率問題。 一個是科技方向,一個是業務方向。


技術方向

    即通過人工智慧科技與OCR科技相結合的管道來提升識別率,特別是對於特殊文字的識別,如手寫、壓蓋等。 智慧字元識別(Intelligent Character Recognition,ICR)這個名詞也因此而產生。


    大多數ICR都帶有一個自學習系統,借助於機器學習(ML)和卷積神經網路(CNN)科技,自動更新識別庫,並通過前期對大量字元集進行標注和訓練,逐步形成所需要的神經網路模型。 另外,ICR還可以通過配寘不同的識別引擎並相互校驗的管道來進行識別。 每個引擎都會被賦予選擇性投票權以確定字元的可信度。 因為各種識別引擎的專長是不一樣的,有的善於識別數位,有的善於識別英文,有的善於識別中文等。 所以,用戶需要根據識別的內容類型自動選擇識別引擎或配寘不同引擎的投票權重。



業務方向

    除科技方向外,另一個就是業務方向,即利用業務管理手段來幫助OCR提高識別率。 例如,採用統一的高拍儀或掃描儀按照規範來獲取影像,而避免個人手機拍攝因為手機的差异、拍攝角度和光線的差异導致識別率降低。 例如,加入預校驗功能,即事先排除那些低識別率的掃描件,直接轉入人工處理,而避免流程進入大批量處理後,再由人工處理。 例如,採用在需要比對的系統使用者介面上直接附著已經切割好的影像切片,這樣就避免了用戶的雙屏來回切換以尋找對比要素的過程。 類似的業務調整和管理手段還有很多,最終目的都是希望減輕業務人員的工作量,提高工作質量和效率。


最後,如果企業仍然覺得OCR科技難以實現和掌握,還可以利用一些互聯網公司提供的雲端服務,如騰訊雲的文字識別提供了身份證、名片、銀行卡、車牌、行駛證、駕駛證、營業執照、通用手寫體、通用印刷體的識別,並提供了後付費和預付費兩種計費模式; 百度雲的文字識別還提供了網絡圖片、火車票、出租車票的識別。 利用雲服務的OCR每次識別的費用相對較低,如果企業對資訊識別量不大,也可以考慮利用雲服務結合RPA來一起使用。


如果對RPA的相關課程感興趣,可以關注我們的微信公眾號-艾塔科技,查看有關RPA課程的培訓視頻,也可以在公眾號中查看我們往期的視頻內容,更好地瞭解RPA。 也可以關注我們本訂閱號,實时瞭解更多資訊。

艾塔科技.png

微信掃一掃,關注“艾塔科技”官方公眾號

RPA.png

微信掃一掃,關注“RPA數位化勞動力”官方公眾號


×