客觀日本

用技術維護網路秩序,SNS公司提高監測AI精度

2022年12月16日 資訊通訊

SNS(社交平台)公司正在推進内容審覈技術的開發。人工智慧(AI)可瞬間識別網際網路上大量發佈的内容,被判斷爲有害的内容將會被自動屏蔽。還可對應曖昧的表述。預計網路活動和網路交流今後將進一步擴大,如何維護網路空間的「秩序」再次成爲迫切課題。

title

各SNS公司一方面加強監測,另一方面維持言論自由的平衡

SNS營運商等主體對發佈内容進行監測與刪除的做法被稱爲「内容審覈」,誹謗中傷、虛假資訊、暴力等有害内容將被停止公開。7月發生的對前首相安倍晉三的槍擊暗殺事件中,犯罪嫌疑人就被認爲是參考了網路上的資訊而製造出了槍支,從預防犯罪的觀點出發,針對有害内容的對策必不可少。

監管網路上發佈的大量内容,關鍵在於AI的進步。營運新聞網站等平台的雅虎,就將使用基於AI的代表性方法——深度學習的自然語言處理技術和其獨有的超級計算機「kukai」來進行監管。

上述系統透過自然語言處理擷取發佈内容,對過度批評、誹謗中傷、歧視等專案的相符程度進行評分。達到一定標準後就會自動刪除,即使未達到標準,分數高的内容也會被進行人工二次審覈。

研究人員將雅虎專業團隊的巡查監測結果等作爲正確資料讓AI學習,旨在再現人的判斷。AI的模式會隨時改善,以提高判斷的妥當性和適應力。該公司負責人稱,從判定評論違規到刪除所需的時間爲「1秒或最遲數秒内。帖子發佈後會立即被刪除」。

當客戶發佈的内容中有較多的表述及個人相關内容時,與人工監測一樣,能在多大程度上正確解讀是否違規已成爲一大課題。營運Instagram和Facebook的美國Meta(前身爲Facebook)公司針對仇恨言論,開發了一種不使用教學資料、由AI對其平台上數百萬條内容進行直接學習的技術。

仇恨言論含有俚語、諷刺等表達方式,其含義和語境易隨時間的推移發生變化,但該公司的技術有望高精度地檢測出是否違規。4~6月,在收到人工報告前AI就已處理的仇恨言論數量佔Facebook處理總數的96%。與2018年同期的53%相比,檢測精度有所提升。

在SNS平台上,客戶爲避免被檢測到違規,故意拼寫錯誤、不使用特定詞語等「兜圈子」現象也反復出現。AI能在多大程度上正確解讀發文意圖,能否掌握顧及言論自由的智慧呢?技術進步掌握着實施安心、安全的網絡社會的鑰匙。

最後需要人類的判斷

title

美國企業家埃隆·馬斯克收購美國Twitter後,内容審覈再度引發關注。如同馬斯克早前曾不滿Twitter對推文内容的監管太嚴格一樣,在言論自由的平衡掌握上,各SNS公司一直面臨着艱難的判斷。

圍繞襲擊美國議會事件、俄羅斯侵入烏克蘭等事件出現了大量虛假資訊。各國政府都在加強管控,各公司也被越來越多地問及對策強化的計劃。AI的精度在逐年提高,已經能夠實施不間斷監測人工無法因應的大量内容,並根據指導方針瞬間進行自動刪除,將來會應用得越來越多。

然而,無論技術多麼先進,最終都離不開人工的判斷。在言論自由和安全之間的微妙界限問題上,對AI的設計、最終的刪除標準等進行深思熟慮十分重要。

眼下美國大型IT公司正進行大規模裁員。有報導稱,此舉對内容審覈的影響令人擔憂,實際負責人權等事務部門的人員被大幅削減。能否堅持不懈地致力於人工參與,將決定技術和網絡社會能否健康隊形變換。

日文:水口二季、《日經產業新聞》、2022/11/25
中文:JST客觀日本編輯部