目前在撰寫科研論文時,使用生成式AI輔助寫作的情況越來越多,全球論文產出量的增長率也確實隨著生成式AI的普及大幅提升。另一方面,生成式AI也開始用於制定研究計劃,再加上各研究領域的深化、跨領域融合研究的增多,科研經費的申請數量也在持續上漲。目前多數科學經費支援機構都禁止在評審中使用生成式AI,難道沒有運用AI減輕評審人員負擔的方法嗎?針對評審輔助AI智慧體研發的相關調研,日本文部科學省決定向國立資訊學研究所相澤彰子教授負責的研究團隊撥付2500萬日圓科學研究費補助金(特別研究促進費)。研究期間為截至下一年度末。
論文出版數量在全球範圍內持續增長,2022年ChatGPT問世後其增長率有所提升。與此同時,AI幻覺問題的影響範圍也隨之擴大。例如,在自然語言處理領域的國際會議入選論文中,不僅參考文獻錯誤逐年增多,單篇論文的平均錯誤數量也在上升。
針對論文寫作中的AI使用問題,多家出版社和學術學會已制定「必須標註是否使用了生成式AI」「禁止將生成式AI列為作者」等相關規範。這類規範的原則是:AI可用於文稿校對等工作,但不能讓生成式AI直接完成論文的寫作。
主流出版社已將生成式AI用於學術不端排查、參考文獻等內容的事實核查。至於是否在審稿時使用AI大多由各機構自行決定,而一項針對1600名科研人員的調查顯示,超半數受訪者有使用生成式AI輔助撰寫審稿結果、生成摘要、開展剽竊檢測的經驗。目前AI論文審稿的應用形式並非是由審稿人使用,而是由作者在投稿前利用AI完成預評審,以此提高論文質量。不過,通用AI的審稿效果並不理想,目前仍處於啟動專用系統研發與試運行的階段。
相比論文審稿,AI在科研經費評審中的應用管控更為審慎。原因在於,論文對應的是已完成的工作,而經費申請針對的是今後擬開展的工作;除了擔憂向第三方生成式AI上傳申請書會造成資訊洩漏外,作為AI研發基礎的開原始資料也嚴重不足。此外,論文與科研經費在領域多樣性、評審目標、評審標準等方面均存在差異,因此為論文審稿等目的開發的系統無法直接套用。
作為科研經費評審領域的AI應用,首先將應用於評審人員的選擇、評審文本的規整、對評審意見的反饋、申請書提交前的核查以及改進意見等用途。
實際上,在評審人員選擇方面,瑞士國家科學基金會(SNSF)、西班牙拉凱克薩基金會、荷蘭研究理事會(NWO)已將AI投入應用。據悉,拉凱克薩基金會已將AI方案作為識別不符合要求申請的工具引入預審系統。英國UK元科學研究組正在實施一項用於輔助科研經費評審的大語言模型(LLM)項目。
另一方面,日本學術振興會(JSPS)、美國NSF等海外資金資助機構(FA),出於資訊洩漏等風險考慮,禁止在評審環節直接使用生成式AI。
此次項目旨在應對申請量增長、減輕評審人員負擔,將整理以「以人為本、高可靠性」為前提、為探討生成式AI輔助評審合理模式提供支撐的見解,並開展面向該模式落地的調查研究。
具體而言,項目將以科研經費評審作為應用場景,將進行擁有評審委員遴選輔助(在考慮基於研究內容等各評審類別中年齡、性別、地區、機構類型等進行平衡的基礎上)、評審意見的整合輔助(為將評審委員的評審意見反饋給申請人,整合並總結多份評審意見的功能)、學術評價輔助(以構建安全的國產基礎設施,並引入能夠輸入申請人研究構想等敏感資訊進行檢索的生成式AI為前提)等功能的AI智慧體的概念設計與部分驗證。
上述項目將著眼於未來將AI評審輔助引入科研經費制度的規劃,為文部科學省及JSPS的制度設計、運營研討提供參考素材。具體將在研究周期內梳理技術可行性、制度適配性、運營層面的議題等內容,反饋可支撐未來決策的相關見解。
原文:《科學新聞》
翻譯:JST客觀日本編輯部

