客觀日本

現代讀腦術,AI將大腦聽到或想像的聲音傳遞給對方

2021年02月09日 資訊通訊

想說的話只要浮現在腦海中即可傳遞給對方——2030年,這種經由人工智慧(AI)的對話和寫作可能會成爲日常。日本東京工業大學的吉村奈津江副教授和碩士生(研究當時)明石航等人開發出了將電極佩戴到頭部測量腦電波,並再現聽到或想到的聲音的方法。在一個簡單的實驗中,AI以約80%的精度復原了受試者的聲音。

title

分析聽到或想到聲音時的腦電波(圖片由東工大的吉村奈津江副教授提供)

大腦會隨着神經細胞的活動產生電和磁,腦血管的血流等也會隨之發生變化。利用腦電波儀和磁共振造影裝置(MRI)等捕捉這種變化,調查活躍的大腦區域等的研究正在進行中。

研究人員還積極推進了利用AI分析並「解讀」複雜的大腦活動模式的研究。雖然尚處於研究階段,但已經可以猜中人看到的物體,以及轉換大腦的動手指令操作機械。

此次,研究團隊開發出了被認爲難以準確再現的聽覺相關的解讀技術。可以利用AI分析腦電波儀取得的資料,擷取並復原聽到的聲音或想到的聲音。

在實驗中,研究團隊向10位受試者播放了頻率成分振幅相等的「白噪音」,讓其從音源中辨認「a」和「i」兩種元音。透過佩戴在頭皮上的32個電極擷取了聽的程序中以及之後回憶時的大腦活動。

研究人員利用名爲「卷積神經網路」的AI分析了腦電波。讓另外19位參與者聆聽根據AI的分析結果合成的聲音發現,能以約80%的精度分辨出「a」或「i」。表示合成聲音和原聲音特徵的波形也高度一致。

研究團隊調查AI解讀聲音時利用的大腦區域發現,主要使用了名爲「What Stream」的聽覺相關區域。人腦中也是相同的區域比較活躍,有望利用該技術調查大腦的活躍部位。

關於AI解析時使用的大腦區域,在聆聽聲音和回憶聲音時往往存在差異,此外還存在個別差異。研究團隊今後還打算調查不同母語以及各種聽覺障礙者之間的差異。

擷取腦内聲音的研究最近取得了很大的進步。美國加利福尼亞大學的研究人員開發出了透過腦電波再現其他人說的由多個英語單詞組成的句子的技術,已於2019年發表相關論文。

這些研究主要採用在顱骨内側的大腦皮質表面貼電極的方法。大多都是在需要貼電極冶癒癲癇等疾病的患者的協助下開展的研究,很難以廣泛的人羣爲物件調查整個大腦。

而此次研究團隊在受試者的頭皮上貼電極,測量了健康人的整個大腦的電訊號。由於是隔着顱骨等傳遞神經細胞的訊號,與以往的方法相比訊號容易衰減。研究團隊設法進行處理,減輕了這些影響。今後將繼續操作進行改良,以再現單詞和句子。

研究進行自然的溝通

如果能即時解讀腦神經的活動,還可以將其轉換爲代替嘴或四肢操作機器人及屏幕上的物體的指令。這類技術被稱爲腦機介面(BCI)等。

20世紀下半期美國等推進了使用動物的基礎研究,目前以醫療領域爲中心,國内外仍在推進相關的技術開發。

吉村副教授等人還打算將該技術應用於因罹患肌萎縮性側索硬化症(ALS)等而導致身體無法活動的「閉鎖症候群」患者。預定近期與秋田大學共同起動以患者爲物件的研究。

該研究已經取得進展,今後的課題是能否提高表達能力。例如,此次吉村副教授等人的研究成果可以再現的聲音僅限於元音。AI如果能擷取人類聽聲方式和說話方式的差異,還有望實施包含情感和方言等在内的自然溝通。

日本還在利用BCI開發針對腦卒中患者的走路復健訓練法,以及減輕失去的肢體感覺到的「幻肢痛」的冶癒方法等。要想加快研究速度,必須構建大腦活動記錄的資料庫,並以低成本開發高性能的腦電波儀等。

日文:Slevin大浜華、《日經產業新聞》、2021年1月29日
中文:JST客觀日本編輯部