人工智慧(AI)正在爲光學字元識別(OCR)技術帶來創新。新技術可以識別寫在紙上的文字資訊,並將其快速數化,用途正在迅速擴大。透過與影像和話音辨識技術相結合,應用範圍還有望擴大到基於多種資訊執行高級任務的「多模態AI」。
變形或者帶有校準標記的文字也能高精度識別 (圖片由AI inside提供)
在繁忙的季節,工作人員經常要加班,甚至沒有其他部門的支援就無法完成工作。爲解決這種情況,橫濱市從2021年度開始導入基於AI的「AI-OCR」識別技術,用於保育所認證的相關工作。
應答申請檔案並輸入到系統中的工作將利用AI-OCR和RPA(機器人流程自動化)實施自動化。2020年度試用了在東證創業板上市的AI Inside公司的技術,應答可以減量500個小時的工作量,該部門的20個工作人員就能因應。
OCR從很早以前就開始用於郵遞區號的識別等,但一直很難用來處理包括種類繁多的漢字等在内的手寫文字,格式也有限。
掀起創新的是AI技術。隨着「深度學習」技術日趨成熟,最近幾年AI-OCR的性能得到提高。資料的積累量也不斷增加,透過大量進行學習,變形的手寫漢字等也已經可以準確識別,甚至還出現了宣稱精度達到90%以上的服務。
使用時先用掃描器掃描檔案,然後用AI識別文字,最後由RPA輸入資訊。截至2020年底,簽約AI inside公司服務的數量達到12900件,增至一年前的約25倍。
爲因應新冠疫情蔓延,日本爲每位國民提供10萬日元補貼,一些地方政府就利用AI-OCR處理了相關的事務工作。京都府舞鶴市利用了Cogent Labs公司(東京港區)的AI-OCR技術和RPA。人工處理的話,每人每天最多隻能處理約200件,而利用AI-OCR能處理2000件。
AI-OCR服務可以顯示出AI在識別文字時的「自信」程度。無法充分擷取時,可以透過人工檢查來防止出錯。
提供AI-OCR服務的Arise Innovation公司(東京·中央)執行長(CEO)清水真表示,「越來越多的人開始認識到該服務可以有效提高工作效率」。部分地方政府還考慮將其用於新冠電腦病毒疫苗接種相關工作。
據調查公司ITR(東京·新宿)預測,日本國内的OCR市場在AI的推動下將以年均20%的速度增長,預計到2024年度市場規模將達到215億日元。雖然今後還必須推進無紙化,但AI-OCR也支援PDF形式的檔案擷取。
目前AI-OCR服務範圍也有可能擴大。AI inside公司開發了結合面部認證(利用駕駛證等的照片)和AI-OCR來提高身份驗證工作效率的系統,已於2月份開始對外提供。在AI研究中,利用影像、聲音和檔案等多種資訊實施高級識別等的多模態AI正成爲新趨勢。
多模態AI有望提高一直由人工負責的各類工作的效率。把用來掌握對話内容的話音辨識和AI-OCR相結合的話,可能會大大改變視窗業務和醫療現場。
日文:AI量子編輯 生川曉、《日本經濟新聞》,2021/04/19
中文:JST客觀日本編輯部