NEC於8月開始試驗性提供自主研發的人工智慧(AI)。儘管只限定於部分客戶,但自3月份開始正式研發以來,僅用了5個月就獲得了這一成果。這是NEC透過招聘精通生成式AI研究和商業化的年輕人,並起動AI專用超級計算機獲得的。NEC力爭將生成式AI培育成重點隊形變換領域。
日本國内AI計算中最大規模的超級計算機於3月開始運行,使得LLM的快速開發成爲可能
小山田昌史主任研究員回顧開發生成式AI的經歷時表示:「多年來使用(生成式AI的基礎)大語言模式(LLM)的工作經驗派上了用場。」
小山田年僅34歲,在NEC内屬於年輕員工,但此次擔任了生成式AI專案的負責人。作爲自然語言處理相關的AI研究員,自2020年起他就開始改進美國谷歌開發的語言模式「BERT」,並發表了多篇學術論文,另一方面,在2018年還主動參加業務推進部門積累了經驗。這些在業務開發方面的經驗以及在公司内建立的人際關係,爲生成式AI的開發提供了有力支援。
從2022年11月美國OpenAI發佈了「ChatGPT」之前,小山田先生就已經預見到LLM有可能改變社會商業格局。隨着ChatGPT迅速傳播,小山田先生更加堅定了自己的想法,並積極志願參與公司内生成式AI的自主研發工作。
在AI的核心技術的機器學習領域,從2000年到2022年,NEC在門檻很高的國際學術會議上獲得透過的論文數量爲215篇,位居世界第十,與排名第八的亞馬遜公司和排名第九的中國騰訊控股(Tencent)不相上下。然而,在AI領域的盈利方面,NEC與海外科技公司之間存在一定差距。因此,越來越多的聲音呼籲提拔年輕員工來擔任關鍵職位,最終公司選擇了小山田。
34歲的小山田擔任生成AI開發負責人
此次開發的大語言模式(LLM)在日語方面性能出色。在複雜和長篇文章的閱讀理解方面,其正確率高於國内外公開的其他LLM。性能指數之一的參數數量爲130億,遠遠少於ChatGPT的基石「GPT-3」。將LLM用於普通伺服器,使客戶能夠降低營運成本和電力消耗。
儘管參數數量較少,但透過增加訓練資料的量來提高LLM的性能。借鑑了在AI研究中積累的經驗,爲LLM提供了適用於學習的資料,不僅包括日語,還包括英語和程式設計語言。小山田指出GPT-3擷取的文件換算成單詞數量相當於數千億個詞3000億個令牌,但NEC的LLM學習的資料量是「GPT-3的數倍以上」。
自3月份開始啓用了適用於學習龐大資料不可或缺的AI計算的大規模超級計算機,對於AI的研究提供了強有力的支援。它搭載了來自美國英偉達公司的928個GPU(圖形處理單位),是日本國内AI計算中規模最大的。
在AI領域,人臉識別技術是NEC的強項,但小山田表示:「人臉識別系統的運用和LLM的大規模學習有很多共通之處」。NEC爲印度國民提供的包含面部生物識別在内的身份認證系統等,積累的與AI相關的大規模基礎設施方面的管理經驗也對LLM的快速學習提供了幫助。
爲實施LLM商業化,專案團隊完善了被稱爲「API」的便於外部企業使用的合作機制和定製功能等開發環境。在7月,還成立了一個100人規模的專家團隊,來指導企業如何有效地使用生成式AI。
許多公司都對這個專案寄予了很大的期望。包括日本東日本鐵路公司、日本三井住友銀行、日本積水建房株式會社以及日本早稻田大學等10家日本代表性的組織將首先嚐試這項技術的應用。
NEC的目標是2025年度之前在生成AI相關業務中實施累計銷售額達到500億日元以上。首席數位官(CDO)吉崎敏文表示:「我們將提供高度專業化的生成AI,起動日本市場。」此次的推出試用是否能成爲日本在起步較晚的AI領域的一次反擊,值得大家關注。
日文:大越優樹、《日經產業新聞》、2023/8/30
中文:JST客觀日本編輯部