NTT開發出了一項通過人工智慧(AI)正確識別出粗糙畫質圖像中被拍攝物的技術。與既往技術相比,具有無需額外補充數據的優點。除圖像之外,該技術還能處理音頻和感測數據,有望擴大AI的應用範圍。

無噪點圖型像(左)與含噪點圖型像的AI識別結果。使用此次研發的技術,即使圖像含有噪點,也能給出接近正確答案的年齡(供圖:NTT)
用於圖形識別的AI需要預先學習大量的圖像數據。在學習過程中,AI會掌握人物和物體圖像所具有的特徵模式。即使面對與學習時不同的圖像數據,AI也能參照所學習的特徵模式來識別拍攝對象。
然而,已學習的特徵模式無法應用於含有噪點的圖像,存在無法正確識別的問題。在昏暗的房間裏拍攝的圖像,或者有強烈陽光照射的圖像,都很容易產生噪點。以往針對這些問題的解決方案是需要補充額外的數據。
NTT研究團隊應用了一種在其他機器學習模型中使用過的方法,將已學習的特徵模式根據使用環境的數據進行了調整。
結果顯示,與需要額外學習數據的既往方法相比,該技術的識別精度僅下降了約一成。將該方法應用在從人像照片中推測年齡的AI時,26歲的人被推測為22.7歲。如果不使用這種方法,會得出1.7歲的結果,與實際年齡完全不符。預計該技術可應用於戶外攝像機所拍攝數據的分析,以及工廠的感測數據解析等領域。
原文:《日本經濟新聞》、2025年4月22日
翻譯:JST客觀日本編輯部