客觀日本

日本2024年版《科學技術創新白皮書》發布:與AI共生,期待與風險並存

2024年07月17日 政策

近日,日本文部科學省編製完成了題為「AI帶來的科學技術與創新的變革」的2024年版《科學技術創新白皮書》,並獲得了日本政府内閣會議的批准。白皮書以特集形式介紹了AI(人工智慧)技術在日本的普及狀況、研發動向,以及在各領域使用AI的可能性。書中還提示了目前面對的課題,展望了日本社會與AI共生的前景。

生成式AI技術取得發展,或將引發「第4次浪潮」

title

2024年版《科學技術與創新白皮書》的封面和封底。由Manga Designers Lab公司提供創意、設計並轉列(供圖:文部科學省)

白皮書如往年一樣分為兩部分,6月11日獲得了内閣批准。第1部分採用了每年切入點都會變化的特集報導形式,繼2022年版日本的研究能力問題、2023年版地方城鎮發起的科技創新事例之後,今年的白皮書聚焦於AI。在概述技術發展史的基礎上,介紹了日本國内外的動向、通過靈活運用AI將為社會與科學帶來的新衝擊。

白皮書在第1部分的開篇,概述了AI的現狀。去年,日本國内AI系統市場的規模相較上一年增長了34.5%。還有預測稱,到2028年之前將以年均30%的速度增長。白皮書指出,AI的發展將助推現行的第6期科學技術與創新基本計劃,通過創新實現人人都能舒適地發揮積極作用的社會。白皮書還指出了存在的課題,即「如何才能做到不只是簡單地引進技術,而能夠將技術與整個社會的創新結合起來,構建社會與技術的伴侶關係」。

白皮書在第1章回顧了AI技術的發展過程。介紹了自1955年美國研究人員使用「AI」一詞以來,隨著技術和方法的發展,AI領域已出現過3次「浪潮」。2010年左右起,得益於機器學習技術等科技的發展,第3次熱潮持續至今,隨著圖像生成、對話式AI等「生成式AI」技術的發展,AI領域正在迎來「第4次浪潮」。

美國Open AI公司開發的「Chat GPT」就是一種對話式生成式AI。客戶可以在網際網路上使用英語和日語等自然語言來利用它,並且由於超大規模學習的進步和準確性的提高,這種AI技術迅速普及到了一般民眾中。根據本文資訊生成圖像的圖像生成式AI也面世。

隨著AI的發展,也出現了一些需要克服的問題。例如,AI學習的數據和計算資源的增加導致了耗電能增加。此外,對話式生成式AI僅能從統計學的角度預測下一個單詞,在不理解對話含義時就做出回應,因此不擅長基於數學計算或物理定律的預測類邏輯推理。為解決這些問題,新一代AI的研發已經啟動。

存在資訊錯誤、價值觀和偏見的風險——應採取措施

白皮書第2章介紹了日本的AI研發狀況。介紹了基於日本政府2022年4月編製的「AI戰略2022」所實施的舉措實例。

目前以Chat GPT為首,能夠利用大量數據和深度學習技術生成人們日常所說語言的「大規模語言模型」的開發,在全球範圍内方興未艾。另一方面,日語能力較強的模型尚少,同時部分企業的壟斷現狀也令人擔憂。為此,日本正在推進高級日語處理模型的開發。日本經濟產業省也已經啟動支援計算資源等舉措。

日本還實現了研究機構與產業界的計算資源共享、計算資源開發及使用環境的構建。日本理化學研究所的超級計算機「富嶽」等被積極用於AI技術的開發和深度學習計算。AI與超級計算機的結合使得大規模數據分析和模型學習成為可能。開發日語的大規模語言模型,充實日本及日語相關的數據庫至關重要。

另一方面,大規模語言模型已被指出存在生成看似正確實為錯誤資訊的「幻覺(hallucination)」問題,存在將包含價值觀、偏見和偏向性的學習數據反映到結果中的風險。日本政府的AI戰略會議指出,AI存在機密資訊洩漏、個人資訊不當使用、犯罪巧妙化、錯誤資訊引發社會混亂等風險。

在此背景下,日本政府於今年2月成立了致力於標準制定等工作的專門機構「AI安全研究所」。日本總務省和經濟產業省制定了運營商指導方針。總務省的研討會還在討論應對包括生成式AI和深度偽造(Deep fake)技術風險在内的綜合性措施,以便在今年夏季前後彙編成冊。

支持確保AI的透明性和可靠性的技術開發也在取得進展。例如,結合外部資訊搜尋的「搜尋擴展生成」技術能夠使輸出結果提供明確的依據。此外,日本還在開發降低圖形識別AI錯誤識別風險的技術,以及在保護隱私的同時分析包含個人資訊的學習數據的機制。白皮書還提到了培養具備AI知識和技能人才的舉措。

白皮書的第3章概述了全球趨勢和國際合作情況。在美國,拜登政府2023年7月至9月間宣佈,15家研發AI的企業已承諾採取基於安全、安保和可靠性三項原則的自主措施。同年10月,美國規定了構成重大安全風險的基礎模型顯影器有報告其安全評估情況的義務。此外,白皮書還介紹了英國、EU(歐盟)、德國、法國、意大利、加拿大、中國和新加坡的舉措。

去年,日本作為G7輪值主席國主導了AI領域的政策討論。在同年5月G7廣島峰會等會議成果的基礎上,日本提出了討論生成式AI各項課題的框架「廣島AI進程」。同年12月,包含國際準則和行為規範的「廣島AI進程綜合政策框架」最終定稿,並獲得了七國集團領導人的批准。

科研用途所需的「透明性」與「保密性」

白皮書在第4章中結合實例介紹了能使科學研究加速的AI「AI for Science」。從去除觀測數據噪音等的「科學數據的改良和資訊提取」、有助於新藥開發等的「模擬的高度化和加速化」、協助家務和護理的機器人所需的「即時預測和控制」、有助於形成超越人類認知極限和偏向性(偏見、先入觀)發現的「科學假設生成和推理」、能夠靈活應對各種條件的「實驗和研究室自主化」等多個方面,介紹了AI的應用潛力。

為了進一步利用AI,理化學研究所等機構正在推進基礎模型和演算法(步驟、程序)的開發。日美合作方面也取得了進展。日本科學技術振興機構(JST)的戰略創造研究推進事業,從2021年度開始,在「以數據驅動、AI驅動為中心的數字化轉型引發的生命科學研究革新」研究領域公開徵集項目,至今已採納並支援了17項研究課題。

使用量子計算機的研究也在加速進行。大規模語言模型不僅被應用於自然語言,也開始應用於讓AI大量學習胺基酸序列等生命科學的研究之中。

隨著AI使實驗和模擬更加高效,研究人員專注於課題設置和研究計劃變得十分重要。

白皮書還指出了在科學研究中使用AI所面臨的挑戰。例如,確保AI模型和學習數據的透明性變得很重要。書中認為,由於AI不一定對内容負責,學術期刊不應承認AI為論文作者,此外,也不應使用AI生成的圖像。幾乎所有AI模型都使用客戶的指令和提問内容作為訓練材料,因此也存在對資訊保密性的擔憂。另外,白皮書還介紹了圍繞AI與著作權、專利的爭議。

白皮書在第5章仲介紹了AI被政府機構和企業積極使用的事例。同時還指出,雖然AI正在成為人們熟悉的技術,但認識其複雜性、「黑盒性」(機制不透明),以及惡意使用的風險等,開展素養教育使人們採取負責任的行為至關重要。

白皮書的第2部分總結了日本政府上一年度推進的科學技術與創新振興措施,並加入了 「2024年能登半島地震研發成果應用事例」「地方公設試驗研究機構的技術開發和海外智慧財產權保護」「近年元科學運動的傳播」等多項專欄内容。

白皮書的封面和卷首插圖描繪了模仿神經細胞的角色和蒲公英的種子,代表AI在各個研究領域得到運用,創造和推廣了新的價值和知識。

title

卷首插圖。描繪了AI在各個研究領域得到運用,創造和推廣了新的價值和知識。由Manga Designers Lab公司提供創意、設計並轉列(供圖:文部科學省)

原文:長崎綠子/JST Science Portal 編輯部
翻譯:JST客觀日本編輯部

【相關鏈結】
·日本文部科學省 科技創新白皮書
·日本内閣府 第6期科技創新基本計劃

日語原文