科學研究 - 用技術維護網路秩序，SNS公司提高監測AI精度

SNS（社交平台）公司正在推進内容審覈技術的開發。人工智慧（AI）可瞬間識別網際網路上大量發布的内容，被判斷為有害的内容將會被自動屏蔽。還可對應曖昧的表述。預計網路活動和網路交流今後將進一步擴大，如何維護網路空間的「秩序」再次成為迫切課題。

各SNS公司一方面加強監測，另一方面維持言論自由的平衡

SNS運營商等主體對發布内容進行監測與刪除的做法被稱為「内容審覈」，誹謗中傷、虛假資訊、暴力等有害内容將被停止公開。7月發生的對前首相安倍晉三的槍擊暗殺事件中，犯罪嫌疑人就被認為是參考了網路上的資訊而製造出了槍支，從預防犯罪的觀點出發，針對有害内容的對策必不可少。

監管網路上發布的大量内容，關鍵在於AI的進步。運營新聞網站等平台的雅虎，就將使用基於AI的代表性方法——深度學習的自然語言處理技術和其獨有的超級計算機「kukai」來進行監管。

上述系統通過自然語言處理擷取發布内容，對過度批評、誹謗中傷、歧視等項目的相符程度進行評分。達到一定標準後就會自動刪除，即使未達到標準，分數高的内容也會被進行人工二次審覈。

研究人員將雅虎專業團隊的巡查監測結果等作為正確數據讓AI學習，旨在再現人的判斷。AI的模型會隨時改善，以提高判斷的妥當性和適應力。該公司負責人稱，從判定評論違規到刪除所需的時間為「1秒或最遲數秒内。帖子發布後會立即被刪除」。

當客戶發布的内容中有較多的表述及個人相關内容時，與人工監測一樣，能在多大程度上正確解讀是否違規已成為一大課題。運營Instagram和Facebook的美國Meta（前身為Facebook）公司針對仇恨言論，開發了一種不使用教學數據、由AI對其平台上數百萬條内容進行直接學習的技術。

仇恨言論含有俚語、諷刺等表達方式，其含義和語境易隨時間的推移發生變化，但該公司的技術有望高精度地檢測出是否違規。4～6月，在收到人工報告前AI就已處理的仇恨言論數量佔Facebook處理總數的96%。與2018年同期的53%相比，檢測精度有所提升。

在SNS平台上，客戶為避免被檢測到違規，故意拼寫錯誤、不使用特定詞語等「兜圈子」現象也反復出現。AI能在多大程度上正確解讀發文意圖，能否掌握顧及言論自由的智慧呢？技術進步掌握著實現安心、安全的網絡社會的鑰匙。

最後需要人類的判斷

美國企業家埃隆·馬斯克收購美國Twitter後，内容審覈再度引發關注。如同馬斯克早前曾不滿Twitter對推文内容的監管太嚴格一樣，在言論自由的平衡掌握上，各SNS公司一直面臨著艱難的判斷。

圍繞襲擊美國議會事件、俄羅斯侵入烏克蘭等事件出現了大量虛假資訊。各國政府都在加強管控，各公司也被越來越多地問及對策強化的計劃。AI的精度在逐年提高，已經能夠實現不間斷監測人工無法應對的大量内容，並根據指導方針瞬間進行自動刪除，將來會應用得越來越多。

然而，無論技術多麼先進，最終都離不開人工的判斷。在言論自由和安全性之間的微妙界限問題上，對AI的設計、最終的刪除標準等進行深思熟慮十分重要。

眼下美國大型IT公司正進行大規模裁員。有報導稱，此舉對内容審覈的影響令人擔憂，實際負責人權等事務部門的人員被大幅削減。能否堅持不懈地致力於人工參與，將決定技術和網絡社會能否健康發展。

日文：水口二季、《日經產業新聞》、2022/11/25
中文：JST客觀日本編輯部

用技術維護網路秩序，SNS公司提高監測AI精度