客觀日本

NEC開發弱標籤學習法,圖形識別AI的追加學習,建立資料時間縮短75%

2022年07月01日 資訊通訊

NEC與理化學研究所開發出了提高圖形識別用人工智慧(AI)開發效率的方法。讓AI學習新物體的識別方法時,只需爲其追加有關物體的正確答案示例即可。由此可以將建立學習資料所需時間縮短至原來的幾分之一。該方法的主要物件爲工程現場和工廠使用的圖形識別AI。

在圖形識別AI的開發中,負擔比較大的工作是由人建立用於AI學習的附帶正確答案(標籤)的資料。比如爲了開發識別車輛類型的AI,需要爲影像中的車輛貼上「客車」或「計程車」等標籤。透過大量擷取並學習帶標籤的影像,AI即使遇到新的影像也能識別出車輛的類型。

title

在這項工作中,常用的學習方法是爲所有要識別的物件貼標籤的「完全標籤學習」法。讓可以識別客車和計程車的AI新學習「摩托車」時,除了影像中的摩托車外,還要爲已經學習過的客車和計程車貼標籤建立正確答案示例。這樣雖然容易開發出高精度AI,但建立學習資料時需要大量的時間和精力。

對此,研究人員探索了讓AI代替人建立學習資料,以及用少量資料實施高精度學習等代替手段。其中一種方法是,僅爲追加物件(摩托車)張貼標籤來建立學習資料的「弱標籤學習」法,其優點是可以大幅縮短張貼標籤所需的時間。

然而,在弱標籤學習法中,AI有時會將沒有標籤的客車和計程車識別爲「背景」,而不是車輛,因此存在圖形識別精度降低等問題。爲使正確答案示例與AI的回答的差值接近於0,研究人員調整了AI學習公式,但弱標籤學習會發生差值變爲負數等意想不到的變化。學習結果不穩定,很難提高AI的精度。

因此,此次在AI的公式中添加了避免差值隨着學習的進展而變爲負數的專案,使得學習結果變得穩定。利用可識別80種物體的AI估算應答,建立增加一個識別物件的學習資料所需的時間縮短至原來的四分之一。

title

識別精度也比以往的弱標籤學習有所提高。在識別0至9的手寫數位的問題上,此前的弱標籤學習AI的平均正確率爲83.09%,而改良版提高至88.63%。識別車和船等10種物體的問題的平均正確率也由29.57%提高至49.98%。

NEC打算將該技術用於開發負責工程現場的工作改善、危險行為監督以及工廠部件檢查等的AI。

日文:寺岡篤志、《日經產業新聞》,2022/6/22
中文:JST客觀日本編輯部