SNS(社交平台)公司正在推進内容審覈技術的開發。人工智慧(AI)可瞬間識別網際網路上大量發布的内容,被判斷為有害的内容將會被自動屏蔽。還可對應曖昧的表述。預計網路活動和網路交流今後將進一步擴大,如何維護網路空間的「秩序」再次成為迫切課題。

各SNS公司一方面加強監測,另一方面維持言論自由的平衡
SNS運營商等主體對發布内容進行監測與刪除的做法被稱為「内容審覈」,誹謗中傷、虛假資訊、暴力等有害内容將被停止公開。7月發生的對前首相安倍晉三的槍擊暗殺事件中,犯罪嫌疑人就被認為是參考了網路上的資訊而製造出了槍支,從預防犯罪的觀點出發,針對有害内容的對策必不可少。
監管網路上發布的大量内容,關鍵在於AI的進步。運營新聞網站等平台的雅虎,就將使用基於AI的代表性方法——深度學習的自然語言處理技術和其獨有的超級計算機「kukai」來進行監管。
上述系統通過自然語言處理擷取發布内容,對過度批評、誹謗中傷、歧視等項目的相符程度進行評分。達到一定標準後就會自動刪除,即使未達到標準,分數高的内容也會被進行人工二次審覈。
研究人員將雅虎專業團隊的巡查監測結果等作為正確數據讓AI學習,旨在再現人的判斷。AI的模型會隨時改善,以提高判斷的妥當性和適應力。該公司負責人稱,從判定評論違規到刪除所需的時間為「1秒或最遲數秒内。帖子發布後會立即被刪除」。
當客戶發布的内容中有較多的表述及個人相關内容時,與人工監測一樣,能在多大程度上正確解讀是否違規已成為一大課題。運營Instagram和Facebook的美國Meta(前身為Facebook)公司針對仇恨言論,開發了一種不使用教學數據、由AI對其平台上數百萬條内容進行直接學習的技術。
仇恨言論含有俚語、諷刺等表達方式,其含義和語境易隨時間的推移發生變化,但該公司的技術有望高精度地檢測出是否違規。4~6月,在收到人工報告前AI就已處理的仇恨言論數量佔Facebook處理總數的96%。與2018年同期的53%相比,檢測精度有所提升。
在SNS平台上,客戶為避免被檢測到違規,故意拼寫錯誤、不使用特定詞語等「兜圈子」現象也反復出現。AI能在多大程度上正確解讀發文意圖,能否掌握顧及言論自由的智慧呢?技術進步掌握著實現安心、安全的網絡社會的鑰匙。
最後需要人類的判斷

美國企業家埃隆·馬斯克收購美國Twitter後,内容審覈再度引發關注。如同馬斯克早前曾不滿Twitter對推文内容的監管太嚴格一樣,在言論自由的平衡掌握上,各SNS公司一直面臨著艱難的判斷。
圍繞襲擊美國議會事件、俄羅斯侵入烏克蘭等事件出現了大量虛假資訊。各國政府都在加強管控,各公司也被越來越多地問及對策強化的計劃。AI的精度在逐年提高,已經能夠實現不間斷監測人工無法應對的大量内容,並根據指導方針瞬間進行自動刪除,將來會應用得越來越多。
然而,無論技術多麼先進,最終都離不開人工的判斷。在言論自由和安全性之間的微妙界限問題上,對AI的設計、最終的刪除標準等進行深思熟慮十分重要。
眼下美國大型IT公司正進行大規模裁員。有報導稱,此舉對内容審覈的影響令人擔憂,實際負責人權等事務部門的人員被大幅削減。能否堅持不懈地致力於人工參與,將決定技術和網絡社會能否健康發展。
日文:水口二季、《日經產業新聞》、2022/11/25
中文:JST客觀日本編輯部