客觀日本

在中國軍團領先的AI「奧林匹克「比賽中,富士通獲得一枚銀牌

2021年08月12日 資訊通訊

在剛剛結束的第32屆夏季奧林匹克比賽(東京奧運2020)中,有富士通選手參賽的日本女藍進入決賽,拿下了銀牌。

不爲公衆所注意的是,富士通的研究團隊在國際人工智慧影片識別大賽中也拿到了銀牌。

title

富士通拿到銀牌的這個競賽叫「2021年AVA挑戰賽」,也即「國際大規模動作識別競賽「。英文縮寫爲Activity Net Challenge,是影片動作識別領域的重要競賽。自 2016 至今,該賽事歷年由谷歌(Google)、臉書(Facebook)、UC 伯克利大學等頂尖院校與研究機構主辦,相關技術在影片分析、活體檢測等多項實際應用中具有重要價值。因此,也有」AI奧林匹克比賽「之稱。

該挑戰賽,聚焦於識別網際網路影片入口網站之中的日常及目標導向的高級行為,旨在進一步拓展影片語義理解的邊界。挑戰賽的比賽結果已在國際電腦視覺和圖形辨識大會(CVPR) 上公佈,並以 Workshop 的形式展示。

title

國際電腦視覺和圖形辨識大會(CVPR)是每年在美國舉行的全球電腦視覺相關的世界頂級學會。近幾年論文錄取率僅在25%左右,錄用標準十分嚴格。由於新冠電腦病毒肆虐,2020-2021年的CVPR均在網上舉行。

AVA挑戰賽比賽的是對影片行為的理解。參賽團隊的演算法需要基於一段影片生成前後連貫的句子,描述其中物體的動作。需要解決影片背景複雜、影片人物相互遮擋及影片解析度不足等干擾問題。還要解決事件序列描述的問題。透過提高AI理解影片内容的效率,將影片轉換成文字和語音。譬如,下圖左爲對前排人物的動作進行描述(抓物體、屈膝、蹲),對後排被部分遮擋的人的動作進行描述;下圖右爲對一段影片的複數人物的動作進行追蹤描述。

title

2021年AVA挑戰賽有兩個獨立的任務:AVA-Kinetics用於原子動作檢測;Active Speaker用於說話人檢測。

title

富士通參賽的是AVA-Kinetics(原子動作檢測)的專案。如上圖所示,上圖左爲對原子動作貼標籤,上圖右爲對動態場景的捕捉。在參賽的11個團隊提交的33份研究成果裏,富士通拿到了銀牌。而金牌與銅牌分別是中國的阿里巴巴與清華大學聯合團隊和OPPO研究院(見下表)。

title

(AVA-Kinetics Challenge Results)

AVA挑戰賽的另一個專案Active Speaker(說話人檢測)的獲獎者分別是中科院、慕尼黑技術大學、新加坡國立大學(見下表)。

title

(AVA-Active Speaker Challenge Results)

從這個AVA挑戰賽也可以看出,中國的人工智慧確實實力不菲。百度在AVA挑戰賽別的任務組裏甚至連獲10個挑戰賽冠軍。入選的22篇優質論文,涵蓋了影像語義分割、本文影片檢索、3D 目標檢測、風格移動、影片理解、移動學習等多個研究方向。中國的曠視、商湯等都有許多研究論文入選。

日本企業團隊在AVA挑戰賽上獲得銀牌似乎尚屬首次。

在剛剛結束的東京奧運2020上,日本桌球混雙戰勝中國隊獲得金牌,日本媒體競相慶賀終於攻下了中國堡壘的一角。在人工智慧(AI)領域,中國領先世界,頗有桌球隊的氣勢。富士通與日本企業的參賽,是否會改變這個局面呢?

供稿 / 戴維 (圖表均取自CVPR與AVA Challenge相關網頁)