科學研究 - 【日本AI的明天】東京能否成為AI開發的全球據點——專訪迅速崛起的「Sakana AI」創始人伊藤錬

2023年，AI初創公司Sakana AI（總部位於東京都港區）在東京成立。作為一家在日本創立的公司，該公司以最快的速度成為了「獨角獸」公司（估值超過10億美元的未上市企業）。Sakana AI推出了一系列顛覆常識的創新成果，包括利用演化方法整合開源AI模型的「演化模型合併（Evolutionary Model Merge）」技術，以及將機器學習領域的研究從構思到論文撰寫實現自動化的「AI科學家」（AI Scientist）等。

這家充滿傳奇色彩的初創公司，由三人共同創立，他們分別是來自金融行業並躋身世界級AI研究人員之列的執行長（CEO）David Ha、曾任職於谷歌公司並作為大規模語言模型（LLM）基礎論文的8位作者之一的首席技術官（CTO）Llion Jones，以及曾在外務省工作、隨後轉型為多家初創企業高管的首席營運長（COO）伊藤錬。

這家公司是如何連續取得的成果的？我們向連日來頻頻接受媒體採訪、進行主題演講的伊藤先生詢問了如何在東京創造吸引AI開發人才之路的見解。

Sakana AI聯合創始人兼COO伊藤錬在東京都內舉辦的活動仲介紹「AI科學家」（2024年12月6日，JST攝影）

不是「海外和日本」，而是「美國西濱海帶和其他地區」

——Sakana AI成立短短數月，就在「演化模型融合」等領域取得了極具影響力的重要成果。來自海外的研究人員似乎是貴公司的中流砥柱，如何讓頂尖研究人員來到日本的呢？

創業之初，許多海外投資者經常擔憂：「日本能否吸引到人才？」但事實上，我們成功吸引了海外的優秀研究人員來到日本。這或許得益於日本依然保留著「科技國家」的形象，以及「只要做出好東西就會被使用的國家」的感覺。

在AI研究中，美國無疑走在最前緣，因此我們每天都在思考日本應該如何做。至少關鍵不是以「海外與日本」的角度來思考問題，而是要以「美國西濱海帶與其他地區」的角度來思考。在矽谷吸引了大量人才的情況下，有一定數量的研究人員希望在其他地區從事研究。放眼全球，谷歌DeepMind設立基地的英國倫敦、逐漸聚集了Mistral等AI企業的法國巴黎、坐擁Cohere等企業的加拿大多倫多等地，正逐漸成為矽谷之外的選項。

Sakana AI於2024年初公佈了所開發的新型基礎模型構建方法「演化模型融合（Evolutionary Model Merge）」的概念圖。通過將現有模型相乘來構建新一代模型，實現了與從零開始構建大型模型相當的精度（供圖：Sakana AI）

開發能力和用例是關鍵

東京能否成為矽谷之外的選項之一？這不僅僅取決於常提到的「城市魅力」和「宜居性」，更關鍵的是這裡「是否有想在那裡工作的有趣的AI公司」。在這方面，比起進行專門針對日語和日本特有課題的開發，更重要的是提供能夠擴展到日本以外的地區，且能展示出不同於其他AI公司的有趣課題。打造「不過是剛好位於日本，但擁有世界級技術的企業」才是關鍵，而我認為，這是可以做到的。

日本也擁有優秀的AI研究人員，Sakana AI也已經吸納了一些人才，但是這個層面仍有提升的空間。出於以國家安全保障的原因，「必須開發國產AI」的話題經常被提及，但最重要的事情是擁有開發AI的能力（capability）。要在日本構建起開發能力，關鍵在於孕育出全球水準的企業。同時，「人」也是產生吸引力的重要因素。正是因為CTO Llion Jones在日本，所以第二、第三個Llions才會隨之而來。我認為打造這樣的連鎖效應是關鍵所在。

在政策方面，我們期待的是不遺餘力地創造「用例（應用事例）」。參考其他國家政府的扶持方案，與補貼、各種活動或稅製相比，政府親自導入AI的有效性更加顯著。例如，將AI用於簽證審查的荷蘭便是一個優秀案例。這不僅有助於AI的發展，更重要的是能夠感受到「AI在行政中可被應用」，從而提升社會整體的AI素養。這將使得AI被更多地運用在社會中，從而最終產生更高的效果。

伊藤錬（JST拍攝）

與潮流不同，但不會過分偏差潮流的「願景」

——Sakana AI之所以能如此迅速地取得較大的成果，除了因為擁有頂級研究人員的加入，經營方面也是否有秘訣呢？

當然，公司在項目管理方面下了功夫，但重要的是「願景管理（Vision Management）」。所謂願景管理，是指在掌握當前趨勢的基礎上，提出「稍有不同但不至於過於不同（different but not too different）」的方向。

例如，從2024年年中開始，AI模型通過數據和計算資源的堆積來提升性能的趨勢逐漸放緩，而通過讓模型之間進行對話來提高「推理（Reasoning）」能力的方向成為新趨勢。此外，也有人認為，到2025年，AI控制個體基礎模型的「代理者（Agent）」時代將正式來臨。

我們從一開始就對「AI模型越大越好」（the bigger，the better）的傾向持懷疑態度，並且比其他人更早地展開了對「代理者（agent）」和「推理」的研究。但這裡的「早」並不是三年，而是提前「半年」的感覺。我們捕捉大家正在關注的內容，同時稍早一步展開不同方向的探索。

「Sakana AI」公司的LOGO徽標。它象徵了公司高效融合世界上龐大開源資源的「集合知識」方法（供圖：Sakana AI）

三位聯合創始人平衡分工不同職責

當然，沒有一種方法是保證能成功的，因此我們用「投資組合」的思路進行管理。在Sakana AI，我們三位共同創始人每天都在思考「哪些領域將會是下一個風口」。然後，我們會從海外引入能夠實現這些願景的人才。如果我們認為有10個領域可能會發展起來，就為每個領域招募一名專家，讓他們嘗試。只要其中一個領域成功，就足夠了。

——這是否意味著需要能夠製定願景、凝聚人心的領導者？

確實如此。與美國OpenAI等公司不同，我們會提出「略顯另類但又不過於離奇」的願景，從而引起員工的興趣。此外，我們展示「Sakana AI的願景是正確的」成功案例，進一步增強公司的凝聚力。

需要注意的是，AI模型的全新開發方法等「研發願景」與如何解決全球課題等「應用案例願景」是截然不同的。試圖強行將兩者結合起來是常見的錯誤做法。如果找不到好的應用案例，整個AI行業都會瀰漫失望情緒。從這個意義上來說，應用案例固然極其重要，但僅僅關注應用案例，可能會扼殺諾貝爾獎級研發的萌芽。因此，我們三位聯合創始人通過分工合作，在保持平衡的同時推進各項業務。

Sakana AI的三位聯合創始人，左起為CEO Ha、CTO Jones、COO伊藤（供圖：Sakana AI）。

開源極其重要

——自2024年12月起，您被東京都任命為政府的「AI戰略會議」的7位委員之一，對此，您有什麼感想呢。

我曾在外務省任職，因此心中懷有「讓日本再次被稱為科技強國」的願望。海外對日本的認知是一個擁有隨身聽、家用遊戲機等技術發達的國家。正因為如此，我才希望能夠再次實現日本的「技術強國夢想」。

同時，Sakana AI是一家主張開源的公司。開源是一個「給予與回報（Give and Take）」的世界。無論是「演化模型融合」還是「AI科學家」，我們所取得的每一項成果都用到了他人創造的東西。因此，我們在迅速公開研發成果進行「給予」方面也不遺餘力。這是因為，讓社會認同「讓他們使用我創造的東西會帶來好處」是極其重要的。

同樣，東京這座城市也是我們的外部環境和生態系統。通過「AI戰略會議」等機會，我們也希望能夠為這個生態系統做出貢獻。

伊藤錬
Sakana AI聯合創始人（COO）
2001年畢業於東京大學法學部，後進入日本外務省工作。曾在日本駐美國大使館任職，在外務省期間，參與了有關日美安保和《歐盟-日本經濟夥伴關係協定》的簽署談判，也曾擔任首相翻譯官。2011年進入世界銀行工作。2015年加入Mercari公司，擔任執行役員（負責全球業務）。2022年加入英國Stability AI公司擔任COO，2023年聯合創辦Sakana AI。2024年12月成為東京都「AI戰略會議」委員。通過與美國英偉達公司及多家日本企業的合作，推進利用自然界原理開發的基礎模型。2004年完成紐約大學法學院課程，2005年完成斯坦福大學研究生院課程。現為紐約州律師、紐約大學法學院高級研究員。同時還擔任美歐三邊委員會委員。

原文：丸山隆一/自由撰稿人/JST Science Portal 編輯部
中文：JST客觀日本編輯部

【相關鏈結】
・Sakana AI：「AI科學家：邁向AI自行研究的時代」
・Sakana AI：「通過演化模型融合賦予視覺語言模型新能力支持多影像處理的日語視覺語言模型公開」
・東京都：「關於召開AI戰略會議」

日語原文