
谷中 瞳
東京大學研究生院情報理工學系研究科
計算機科學專業 副教授
出生於東京都。2018年完成東京大學研究生院工學系研究科系統創成學專業博士課程。獲得博士(工學)稱號。經過民營企業工作以及出任理化學研究所革新智慧統合研究中心特別研究員後,2023年起擔任現職。2021年入選「先驅科研人」。
Q1.讓您立志成為研究者的契機是什麼?
A1.直面專利文獻檢索技術的難題
我接觸到自然語言處理這一研究領域是在畢業之後。儘管我本科和研究生期間的專業是應用化學,但出於對IT領域的興趣,畢業後我進入一家民營企業作為工程師從事專利檢索系統的開發工作。轉折點為接到用戶的反饋,對方指出:「目前的系統在檢索包含數量表述的專利文獻時,表現差強人意」。
專利文獻中存在很多像「10克試劑」這樣的數量表述,但當時的技術難以精準檢索含有此類數值的文獻。在深入調查的過程中,我發現這個問題無法通過簡單的模式配對分組來解決,而且在自然語言處理領域這也是一個尚未攻克的技術難題。由此,我意識到必須開展深入的基礎性研究,並萌生了親自攻克該難題的想法。
當時,是我工作的第三個年頭,以前我就有成為研究者的憧憬,覺得「要實現憧憬就是現在了」,於是選擇了離開企業去攻讀博士學位。儘管在接近而立之年轉換專業領域心有不安,但如今回頭看,我覺得那是一個正確的決定。
Q2.目前正在進行什麼研究?
A2.以形式化方式表述邏輯性語言的含義
目前自然語言處理領域的主流是大規模語言模型,採用的是從海量數據中通過統計來學習語言含義的方法。但在準確理解數量表達、否定表達、時間表達等具有嚴格文法功能的表達時仍存在課題。對此,我按照邏輯學中使用的概念,結合對語言含義進行形式化分析的「形式語意學」方法,對「並且」、「所有的」等邏輯性語言藉助邏輯符號進行更穩妥的處理。

參加保加利亞國際會議時的發表照片
通過將形式化方法與統計學方法相融合,能夠更精確地理解語言的含義,從而更準確地判斷句子之間的相似性以及邏輯關係。在「先驅科研人」研究項目中,我們將該技術應用到了圖像領域,研究如何讓AI準確識別圖像中物體的數量、位置關係,例如「從右數第二個」這樣的邏輯關係。研究通過邏輯表達的方式,將圖像資訊與文本資訊的意義進行關聯,並以類似數學證明的方式展示兩者之間的關係,從而使AI能夠提示判斷依據。
今後,我們的目標是開發出一種能夠以通俗易懂的方式呈現邏輯推理依據的系統,實現「可信賴的AI」。我認為,確保AI的安全性以及消除輸出偏差的能力,與構建人際間信任關係具有相通性。未來,如果AI能成為家人般的存在,將會是一件非常有趣的事情。
Q3.您對立志成為研究者的人有何建議
A3.持續保持勇於挑戰的態度
我在學生時代並不清楚自己喜歡什麼、想做什麼。對此我建議在那個階段首先要全力以赴地做好眼前的事情。在這個過程中,一定會發現自己的興趣和擅長的領域。重要的是始終保持挑戰各種事物的姿態。只有真正去嘗試,才能知道什麼是適合自己的。
就我而言,雖然我從應用化學專業轉到了資訊科學專業,但學習化學的經歷並沒有被浪費。看起來像是走了彎路,但正因為有了學習不同領域知識的經歷,我才能以不拘泥於既有框架的視角來開展現在的研究。
對於立志成為研究者的各位,我希望大家在拓寬自己興趣範圍的同時,能夠開闢屬於自己的道路。獲取新的知識,發現別人未曾注意到的課題,這些都有助於自我成長,也一定會讓自己的人生變得更加豐富多彩。(TEXT:村上佳代)

這是我彈奏爵士樂鋼琴時的照片。大學時期我曾加入過爵士樂研究會
原文:JSTnews 2025年3月號
翻譯:JST客觀日本編輯部