科學研究 - 5個月提供生成AI試用，啟用年輕人縮短開發

NEC於8月開始試驗性提供自主研發的人工智慧（AI）。儘管隻限定於部分客戶，但自3月份開始正式研發以來，僅用了5個月就獲得了這一成果。這是NEC通過招聘精通生成式AI研究和商業化的年輕人，並啟動AI專用超級計算機獲得的。NEC力爭將生成式AI培育成重點發展領域。

日本國内AI計算中最大規模的超級計算機於3月開始運行，使得LLM的快速開發成為可能

小山田昌史主任研究員回顧開發生成式AI的經歷時表示：「多年來使用（生成式AI的基礎）大語言模型（LLM）的工作經驗派上了用場。」

小山田年僅34歲，在NEC内屬於年輕員工，但此次擔任了生成式AI項目的負責人。作為自然語言處理相關的AI研究員，自2020年起他就開始改進美國谷歌開發的語言模型「BERT」，並發表了多篇學術論文，另一方面，在2018年還主動參加業務推進部門積累了經驗。這些在業務開發方面的經驗以及在公司内建立的人際關係，為生成式AI的開發提供了有力支持。

從2022年11月美國OpenAI發布了「ChatGPT」之前，小山田先生就已經預見到LLM有可能改變社會商業格局。隨著ChatGPT迅速傳播，小山田先生更加堅定了自己的想法，並積極志願參與公司内生成式AI的自主研發工作。

在AI的核心技術的機器學習領域，從2000年到2022年，NEC在門檻很高的國際學術會議上獲得通過的論文數量為215篇，位居世界第十，與排名第八的亞馬遜公司和排名第九的中國騰訊控股（Tencent）不相上下。然而，在AI領域的盈利方面，NEC與海外科技公司之間存在一定差距。因此，越來越多的聲音呼籲提拔年輕員工來擔任關鍵職位，最終公司選擇了小山田。

34歲的小山田擔任生成AI開發負責人

此次開發的大語言模型（LLM）在日語方面性能出色。在複雜和長篇文章的閱讀理解方面，其正確率高於國内外公開的其他LLM。性能指數之一的參數數量為130億，遠遠少於ChatGPT的基石「GPT-3」。將LLM用於普通伺服器，使客戶能夠降低運營成本和電力消耗。

儘管參數數量較少，但通過增加訓練數據的量來提高LLM的性能。借鑑了在AI研究中積累的經驗，為LLM提供了適用於學習的數據，不僅包括日語，還包括英語和程式設計語言。小山田指出GPT-3擷取的文件換算成單詞數量相當於數千億個詞3000億個令牌，但NEC的LLM學習的數據量是「GPT-3的數倍以上」。

自3月份開始啟用了適用於學習龐大數據不可或缺的AI計算的大規模超級計算機，對於AI的研究提供了強有力的支持。它搭載了來自美國英偉達公司的928個GPU（圖形處理單位），是日本國内AI計算中規模最大的。

在AI領域，人臉識別技術是NEC的強項，但小山田表示：「人臉識別系統的運用和LLM的大規模學習有很多共通之處」。NEC為印度國民提供的包含面部生物識別在内的身份認證系統等，積累的與AI相關的大規模基礎設施方面的管理經驗也對LLM的快速學習提供了幫助。

為實現LLM商業化，項目團隊完善了被稱為「API」的便於外部企業使用的合作機制和定製功能等開發環境。在7月，還成立了一個100人規模的專家團隊，來指導企業如何有效地使用生成式AI。

許多公司都對這個項目寄予了很大的期望。包括日本東日本鐵路公司、日本三井住友銀行、日本積水建房株式會社以及日本早稻田大學等10家日本代表性的組織將首先嚐試這項技術的應用。

NEC的目標是2025年度之前在生成AI相關業務中實現累計銷售額達到500億日元以上。首席數字官（CDO）吉崎敏文表示：「我們將提供高度專業化的生成AI，啟動日本市場。」此次的推出試用是否能成為日本在起步較晚的AI領域的一次反擊，值得大家關注。

日文：大越優樹、《日經產業新聞》、2023/8/30
中文：JST客觀日本編輯部

5個月提供生成AI試用，啟用年輕人縮短開發

相關閱讀

「遊戲有改善心理健康和提升生活滿意度的效果」——日本大學等利用新冠疫情開展研究

全球數字政府排名：日本第11，新加坡時隔7年重返榜首

東京大學成功將世界上最精確的「光晶格鐘」小型化

光量子計算機實現首次遠程使用，通過模擬連續量的光量子位元進行計算

國際交流

專題報導

鏈結集