客觀日本

【日本AI的明天】東京能否成為AI開發的全球據點——專訪迅速崛起的「Sakana AI」創始人伊藤錬

2025年03月07日 資訊通信

2023年,AI初創公司Sakana AI(總部位於東京都港區)在東京成立。作為一家在日本創立的公司,該公司以最快的速度成為了「獨角獸」公司(估值超過10億美元的未上市企業)。Sakana AI推出了一系列顛覆常識的創新成果,包括利用演化方法整合開源AI模型的「演化模型合併(Evolutionary Model Merge)」技術,以及將機器學習領域的研究從構思到論文撰寫實現自動化的「AI科學家」(AI Scientist)等。

這家充滿傳奇色彩的初創公司,由三人共同創立,他們分別是來自金融行業並躋身世界級AI研究人員之列的執行長(CEO)David Ha、曾任職於谷歌公司並作為大規模語言模型(LLM)基礎論文的8位作者之一的首席技術官(CTO)Llion Jones,以及曾在外務省工作、隨後轉型為多家初創企業高管的首席營運長(COO)伊藤錬。

這家公司是如何連續取得的成果的?我們向連日來頻頻接受媒體採訪、進行主題演講的伊藤先生詢問了如何在東京創造吸引AI開發人才之路的見解。

title

Sakana AI聯合創始人兼COO伊藤錬在東京都內舉辦的活動仲介紹「AI科學家」(2024年12月6日,JST攝影)

不是「海外和日本」,而是「美國西濱海帶和其他地區」

——Sakana AI成立短短數月,就在「演化模型融合」等領域取得了極具影響力的重要成果。來自海外的研究人員似乎是貴公司的中流砥柱,如何讓頂尖研究人員來到日本的呢?

創業之初,許多海外投資者經常擔憂:「日本能否吸引到人才?」但事實上,我們成功吸引了海外的優秀研究人員來到日本。這或許得益於日本依然保留著「科技國家」的形象,以及「只要做出好東西就會被使用的國家」的感覺。

在AI研究中,美國無疑走在最前緣,因此我們每天都在思考日本應該如何做。至少關鍵不是以「海外與日本」的角度來思考問題,而是要以「美國西濱海帶與其他地區」的角度來思考。在矽谷吸引了大量人才的情況下,有一定數量的研究人員希望在其他地區從事研究。放眼全球,谷歌DeepMind設立基地的英國倫敦、逐漸聚集了Mistral等AI企業的法國巴黎、坐擁Cohere等企業的加拿大多倫多等地,正逐漸成為矽谷之外的選項。

title

Sakana AI於2024年初公佈了所開發的新型基礎模型構建方法「演化模型融合(Evolutionary Model Merge)」的概念圖。通過將現有模型相乘來構建新一代模型,實現了與從零開始構建大型模型相當的精度(供圖:Sakana AI)

開發能力和用例是關鍵

東京能否成為矽谷之外的選項之一?這不僅僅取決於常提到的「城市魅力」和「宜居性」,更關鍵的是這裡「是否有想在那裡工作的有趣的AI公司」。在這方面,比起進行專門針對日語和日本特有課題的開發,更重要的是提供能夠擴展到日本以外的地區,且能展示出不同於其他AI公司的有趣課題。打造「不過是剛好位於日本,但擁有世界級技術的企業」才是關鍵,而我認為,這是可以做到的。

日本也擁有優秀的AI研究人員,Sakana AI也已經吸納了一些人才,但是這個層面仍有提升的空間。出於以國家安全保障的原因,「必須開發國產AI」的話題經常被提及,但最重要的事情是擁有開發AI的能力(capability)。要在日本構建起開發能力,關鍵在於孕育出全球水準的企業。同時,「人」也是產生吸引力的重要因素。正是因為CTO Llion Jones在日本,所以第二、第三個Llions才會隨之而來。我認為打造這樣的連鎖效應是關鍵所在。

在政策方面,我們期待的是不遺餘力地創造「用例(應用事例)」。參考其他國家政府的扶持方案,與補貼、各種活動或稅製相比,政府親自導入AI的有效性更加顯著。例如,將AI用於簽證審查的荷蘭便是一個優秀案例。這不僅有助於AI的發展,更重要的是能夠感受到「AI在行政中可被應用」,從而提升社會整體的AI素養。這將使得AI被更多地運用在社會中,從而最終產生更高的效果。

title

伊藤錬(JST拍攝)

與潮流不同,但不會過分偏差潮流的「願景」

——Sakana AI之所以能如此迅速地取得較大的成果,除了因為擁有頂級研究人員的加入,經營方面也是否有秘訣呢?

當然,公司在項目管理方面下了功夫,但重要的是「願景管理(Vision Management)」。所謂願景管理,是指在掌握當前趨勢的基礎上,提出「稍有不同但不至於過於不同(different but not too different)」的方向。

例如,從2024年年中開始,AI模型通過數據和計算資源的堆積來提升性能的趨勢逐漸放緩,而通過讓模型之間進行對話來提高「推理(Reasoning)」能力的方向成為新趨勢。此外,也有人認為,到2025年,AI控制個體基礎模型的「代理者(Agent)」時代將正式來臨。

我們從一開始就對「AI模型越大越好」(the bigger,the better)的傾向持懷疑態度,並且比其他人更早地展開了對「代理者(agent)」和「推理」的研究。但這裡的「早」並不是三年,而是提前「半年」的感覺。我們捕捉大家正在關注的內容,同時稍早一步展開不同方向的探索。

title

「Sakana AI」公司的LOGO徽標。它象徵了公司高效融合世界上龐大開源資源的「集合知識」方法(供圖:Sakana AI)

三位聯合創始人平衡分工不同職責

當然,沒有一種方法是保證能成功的,因此我們用「投資組合」 的思路進行管理。在Sakana AI,我們三位共同創始人每天都在思考「哪些領域將會是下一個風口」。然後,我們會從海外引入能夠實現這些願景的人才。如果我們認為有10個領域可能會發展起來,就為每個領域招募一名專家,讓他們嘗試。只要其中一個領域成功,就足夠了。

——這是否意味著需要能夠製定願景、凝聚人心的領導者?

確實如此。與美國OpenAI等公司不同,我們會提出「略顯另類但又不過於離奇」的願景,從而引起員工的興趣。此外,我們展示「Sakana AI的願景是正確的」成功案例,進一步增強公司的凝聚力。

需要注意的是,AI模型的全新開發方法等「研發願景」與如何解決全球課題等「應用案例願景」是截然不同的。試圖強行將兩者結合起來是常見的錯誤做法。如果找不到好的應用案例,整個AI行業都會瀰漫失望情緒。從這個意義上來說,應用案例固然極其重要,但僅僅關注應用案例,可能會扼殺諾貝爾獎級研發的萌芽。因此,我們三位聯合創始人通過分工合作,在保持平衡的同時推進各項業務。

title

Sakana AI的三位聯合創始人,左起為CEO Ha、CTO Jones、COO伊藤(供圖:Sakana AI)。

開源極其重要

——自2024年12月起,您被東京都任命為政府的「AI戰略會議」的7位委員之一,對此,您有什麼感想呢。

我曾在外務省任職,因此心中懷有「讓日本再次被稱為科技強國」的願望。海外對日本的認知是一個擁有隨身聽、家用遊戲機等技術發達的國家。正因為如此,我才希望能夠再次實現日本的「技術強國夢想」。

同時,Sakana AI是一家主張開源的公司。開源是一個「給予與回報(Give and Take)」的世界。無論是「演化模型融合」還是「AI科學家」,我們所取得的每一項成果都用到了他人創造的東西。因此,我們在迅速公開研發成果進行「給予」方面也不遺餘力。這是因為,讓社會認同「讓他們使用我創造的東西會帶來好處」是極其重要的。

同樣,東京這座城市也是我們的外部環境和生態系統。通過「AI戰略會議」等機會,我們也希望能夠為這個生態系統做出貢獻。

title

伊藤錬
Sakana AI聯合創始人(COO)
2001年畢業於東京大學法學部,後進入日本外務省工作。曾在日本駐美國大使館任職,在外務省期間,參與了有關日美安保和《歐盟-日本經濟夥伴關係協定》的簽署談判,也曾擔任首相翻譯官。2011年進入世界銀行工作。2015年加入Mercari公司,擔任執行役員(負責全球業務)。2022年加入英國Stability AI公司擔任COO,2023年聯合創辦Sakana AI。2024年12月成為東京都「AI戰略會議」委員。通過與美國英偉達公司及多家日本企業的合作,推進利用自然界原理開發的基礎模型。2004年完成紐約大學法學院課程,2005年完成斯坦福大學研究生院課程。現為紐約州律師、紐約大學法學院高級研究員。同時還擔任美歐三邊委員會委員。

原文:丸山隆一/自由撰稿人/JST Science Portal 編輯部
中文:JST客觀日本編輯部

【相關鏈結】
・Sakana AI:「AI科學家:邁向AI自行研究的時代
・Sakana AI:「通過演化模型融合賦予視覺語言模型新能力 支持多影像處理的日語視覺語言模型公開
・東京都:「關於召開AI戰略會議

日語原文