2024年的諾貝爾物理學獎授予了約翰·霍普菲爾德(美國普林斯頓大學)和傑弗裏·辛頓(加拿大多倫多大學)。該獎項是對他們在使基於人工神經元網路的機器學習成為可能的發現和發明方面的認可。人工神經元網路正是當今AI的基礎。
類似的研究在日本也曾進行國,甚至起步更早。日本國立研究開發法人理化學研究所(以下稱「理研」)的甘利俊一先生(榮譽研究員/原腦科學綜合研究中心主任)就是該研究的核心人物,他針對此次諾貝爾物理學獎發表了評論,在祝賀兩位獲獎者的同時,還提到「人工智慧和神經元網路理論研究的源頭在日本也曾有過……」。
作為本次專訪的上篇,我們請甘利先生回顧了曾經的「源頭」景象,並請他講述了那些與當今AI技術相關的研究成果是如何在日本誕生的。

理研的甘利俊一先生(榮譽研究員/原腦科學綜合研究中心主任),至今仍是活躍在一線的研究學者
20世紀60年代初,年輕研究學者自發組成的研究小組開發了理論
——請您回顧一下AI研究的歷史,並談談您是從何時開始參與的?
回顧AI研究就會發現,直至今日,它經歷了多次熱潮和低谷的起伏。
最初的AI研究,是通過編寫計算機程序來實現智慧的。不過,與此同時,也出現了一種觀點:既然人類的大腦是通過學習來獲得智慧功能的,那麼在計算機中構建人工腦神經網路並讓其學習,是否就能實現類似人類的智慧呢?
這便是美國心理學家弗蘭克·羅森布拉特提出的腦型學習機器「感知機」。這大約是在1950~60年代的事情。如今的AI正是這種感知機的演化。
從研究的早期階段開始,就有人認為應該將其與大腦研究相結合。也就是說,從資訊的角度研究大腦的機制,或許能讓我們對人工智慧有新的發現。

「感知機是最初的研究」
我1963年從東京大學完成博士課程,之後前往九州大學任職,我的專業是數理工學。數理工學的理念是,用數學思維去探究世間萬物的機制,從而實現理論上的闡釋。因此,研究對象可以是任何事物。我自己也研究過很多不同的內容。
我到九州大學任職時,正是羅森布拉特的感知機收到關注的時候。我對在計算機中編寫類似神經元網路的程序並讓其學習,從而實現圖形辨識的想法產生了濃厚興趣。
於是,我和幾位數學專業的年輕研究學者一起成立了一個跨學科研究小組,專門研究「感知機」。這是我首次直接參與AI相關的研究。

感知機的工作原理(編輯部根據甘利先生的原畫繪製)
想出讓中氣層也能學習的構造
——在那個自發研究小組中誕生的「隨機梯度下降法」,與此次諾貝爾物理學獎所認可的研究成果有關,您能簡單介紹一下嗎?
沒錯。羅森布拉特設想的學習機器的模型由三層構成,分別是接收輸入信號的「輸入層」、進行資訊轉換的「中氣層」以及最終做出決策的「輸出層」。學習僅在最後一層進行,中氣層隻負責資訊處理。
而我們則構思出了讓中氣層也能學習的構造。那麼,如何讓機器在中氣層也能學習呢?當時的人工神經元(模擬大腦神經細胞的模型)是開/關的二進制類型,其機制是如果回答錯誤,就對輸出層的元件進行修改,由此實現學習。

「大腦神經細胞的輸入輸出實際上是模擬信號」
而我們想到了「模擬神經元」,即一個神經元不只是處於「開」(1)或「關」(0)的狀態,而是可以接收和輸出如「3.61」或「0.12」這樣連續變化的模擬量。我們認為這樣就能讓中氣層也能進行學習,機器學習也就能更順利地進行。實際上,真正大腦神經細胞的輸入和輸出也是模擬信號。
將這個機制應用到神經元網路模型中即可。學習時如果回答錯誤,無論是在最後輸出層還是中氣層,在資訊接收的連接點處稍微改變模擬量,最終的答案就會稍有變化。通過微分可以瞭解逐個改變眾多參數時答案的變化情況,朝著接近正確答案的方向調整,學習就能不斷推進。在數學上,這被稱為「梯度」。我們將此內容整理成論文於1967年發表。遺憾的是,當時社會上對人工智慧的熱情退潮,到了1970年代,這項研究在全球範圍內都陷入了低谷。

AI研究的歷史(供圖:日本總務省)
神經元網路的研究,「日本也有源頭」
——然後,1970年代後期到1980年代迎來了第二次熱潮。
是的。1986年,一篇關於「誤差反向傳播演算法」的論文發表,其機器學習的思路與我們1967年論文中提出的想法完全一致。然而,當時計算機的性能有了顯著提升,計算機模擬也能大規模進行,由此掀起了第二次熱潮。然而,我們早先提出的理論卻完全被遺忘了。
另一方面,日本當時將腦科學和數理資訊科學相結合、以數學方法研究大腦的活動變得活躍起來。以東京大學的伊藤正男老師為核心,啟動了一個大規模研究大腦的團隊項目。他們認為其中也應該納入理論研究學者,我也因此參與其中。

「六七十年代日本是最先進的國家」
福島先生和我等幾位研究學者率先開展了大腦模型的研究。當時的日本提出了各種神經元網路模型,或許在這個領域是最先進的國家。在與AI相關的領域,我們在1970年代構思了「聯結記憶」模型。我們思考大腦是如何記憶和回憶事物的,認為大腦可能是通過聯想讓相關資訊浮現出來,於是構建了聯結記憶模型並進行了數學公式化。
有趣的是,聯結記憶和隨機梯度下降法這兩項成果,與此次諾貝爾物理學獎被認可的成就相關。雖然並非直接關聯,但他們重新發現了我們的想法並加以發展,才有了如今AI的進步。
事實上,如果看了霍普菲爾德的論文,就會發現其中引用了我的論文,但被引用的是沒有直接關聯的論文。我的聯結記憶論文並未被直接引用,引用的是我後來寫的關於自組織的論文。我不知道為何會出現這樣的引用錯誤,不過這種事情確實會發生。
——關於此次諾貝爾物理學獎的評論中,您寫到「日本也有源頭」,這句話有什麼含義呢?
此次諾貝爾物理學獎所認可的研究源頭之一是隨機梯度下降法。雖然該方法看似理所當然,但提出神經元網路的感知機可以用隨機下降法進行學習的第一人是我。
正如我前面提到的,霍普菲爾德的聯結記憶模型,其實日本之前就提出了相同的模型。中氣層深度疊加處理的深度學習機制,也與福島先生提出的「新認知機」基本相同,這也是日本在1978年左右就已開展的研究。
所以我才寫下「日本也有源頭」。然而,在寫那條評論的初稿時,我曾猶豫要不要直接寫成「源頭在日本」。但我認為那樣可能太狂妄了,畢竟在日本開展研究之前就有羅森布拉特等先驅者,我們也是受到了他們的影響才開展研究的。所以我認為「日本也有源頭」的表述更為恰當。

甘利先生對2024年諾貝爾物理學獎的評論(供圖:理研)

甘利俊一
原文:宇津木聰史/JST Science Portal 編輯部
翻譯:JST客觀日本編輯部