Instagram如何利用AI進行內容稽覈?

Instagram如何利用AI進行內容稽覈?

文章目录

  • Instagram上的AI內容稽覈
  • 1. 影像/影片分析:
  • 2. 光學字元識別 (Rosetta):
  • 3. 語言理解 (NLP):
  • 個性化與使用者體驗提升
  • 人工智慧對抗網路欺凌和垃圾郵件
  • Instagram使用的技術摘要
  • AI稽覈的優勢是什麼?
  • AI稽覈的挑戰和侷限性
  • 小結
  • 常見問題

Instagram如何利用AI進行內容稽覈?

Instagram 廣泛使用人工智慧 (AI) 進行內容過濾和稽覈,以維護安全積極的使用者體驗。這些 AI 系統會自動檢測並刪除違反 Instagram 社羣準則的內容,例如仇恨言論、欺凌、裸露、暴力和垃圾資訊,並在使用者舉報之前進行處理。這一過程結合了機器學習模型、自然語言處理和卷積神經網路等計算機視覺技術。本文將嘗試揭示 Instagram 在維持其平臺積極友好的使用者體驗的同時,背後的機制。

Instagram上的AI內容稽覈

Instagram 的 AI 系統會自動檢測並刪除違反其社羣準則的內容,例如仇恨言論、欺凌、裸露、暴力畫面和垃圾資訊,而且通常在使用者舉報之前就會執行。

1. 影像/影片分析:

Instagram 使用深度 CNN 分類器來識別停用視覺內容。例如,它在大型、帶標籤的“不適當圖片與安全圖片”資料集上訓練卷積網路(通常是 ResNet 風格的主幹網路)。它還使用目標檢測模型(像 YOLO 這樣的單階段檢測器或像 Faster R-CNN 這樣的雙階段檢測器)來定位露骨內容。Instagram 的母公司 Meta 指出,當準確性至關重要時,它可以使用 YOLO 進行快速即時影片掃描,並使用例如 ResNet 或 ShuffleNet 主幹網路的 Faster R-CNN。實際上,如果影像的畫素與裸體、武器、影像和暴力影像的模式匹配,CNN 就會對其進行標記。

2. 光學字元識別 (Rosetta):

許多帖子會嵌入文字,例如表情包、螢幕截圖和帶標題的圖片,因此 Instagram 使用專門的 OCR 流程(Meta 的 Rosetta 系統)來提取疊加的文字。然後,Rosetta 執行一個兩階段視覺模型。首先是一個 Faster R-CNN 變體,用於檢測矩形文字區域;然後是一個基於 Resnet-18 且帶有 CTC(序列)損失的 CNN,用於讀取每個單詞。

例如,一個表情包“1 個贊 = 1 個祈禱”會被檢測並轉錄。這段文字會被輸入到稽覈引擎中。Rosetta 的 CNN+LSTM 識別器基於合成和真實的多語言資料進行訓練,使 Instagram 能夠捕捉隱藏在圖片中的仇恨言論或垃圾資訊。

3. 語言理解 (NLP):

圖片說明、評論和訊息由自然語言模型處理。Instagram 應用演算法(通常是基於 Transformer 的文字分類器和 RNN)來根據社羣準則對內容進行評分。

例如,評論會被使用學習到的嵌入或類似 BERT 的模型進行向量化,然後輸入到垃圾資訊/仇恨分類器中。透過學習文字中的模式,可以識別辱罵性語言、騷擾、褻瀆或仇恨內容。雖然具體的內部模型是專有的,但 Meta 已證明其使用最先進的 NLP 架構來大規模稽覈數十種語言。在實踐中,根據置信度,由視覺或 NLP 子系統標記的帖子會被自動遮蔽或送交人工稽覈。

這種 AI-人類混合方法將 AI 的速度和規模與人類的細緻決策相結合,然後利用來自人類稽覈員的反饋來重新訓練模型,使系統隨著時間的推移變得更加智慧。

AI-人類混合方法

Source: Spectrumlabsai

個性化與使用者體驗提升

Instagram 的動態、“探索”標籤和 Reels 依靠機器學習排名模型來個性化每位使用者的體驗。該系統是一個多階段推薦系統:

首先,它從關注的賬號、熱門標籤、相似使用者的帖子等中檢索大量候選帖子。然後,透過深度學習對它們進行排名。在檢索過程中,Instagram 使用雙塔神經網路,一個“塔”處理使用者特徵,例如人口統計、歷史記錄、興趣;另一個“塔”處理媒體特徵,例如帖子後設資料、內容嵌入。

每個“塔”通常是一個前饋網路,通常從類似 Word2Vec 的 ID 嵌入開始,學習緊湊的使用者/專案向量。訓練目標是使使用者與專案互動時,使用者和專案的嵌入接近。在服務時,使用者的“塔”和近似最近鄰 (ANN) 索引(例如,使用 FAISS)會生成數千個候選帖子進行排名。這種雙塔方法具有高度可快取性,並允許從數十億個專案中即時檢索。

檢索到候選帖子後,Instagram 會應用兩階段深度排名模型。第一階段的排名器是一個輕量級神經網路,它會對每個使用者的數千條帖子進行評分(通常從更重的模型中提取知識)。第二階段是一個更重的多工多標籤神經網路 (MTML),它會選取排名前 100 位的候選帖子並預測詳細的參與機率(點選、點贊、評論、觀看等)。這個 MTML 模型是一個透過反向傳播訓練的前饋深度網路,它可以同時提取豐富的特徵,例如使用者興趣、帖子內容向量、過去的互動指標等以及多個機率。簡而言之,深度神經網路負責帖子的檢索和最終排名,從而使 Instagram 能夠根據每個使用者的偏好對動態進行排序。這種個性化設定透過為每個使用者展示最相關的內容來保持較高的參與度。

使用者社交行為圖形

Source: Daffodil

人工智慧對抗網路欺凌和垃圾郵件

除了內容和排名之外,Instagram 還應用人工智慧來打擊垃圾郵件機器人和騷擾。例如,

  1. 垃圾郵件檢測:傳送大量私信或評論(例如網路釣魚詐騙)的賬戶會被模式學習模型標記。Instagram 可以根據發帖頻率、訊息相似度、點選率和賬戶後設資料等特徵,訓練整合模型或神經網路等二分類器。任何非自然模式,例如自動私信、重複連結或“點贊”方案,都會觸發反垃圾郵件過濾器。Rosetta 的 OCR 技術也在這方面有所幫助;它可以讀取圖片/表情包中的垃圾文字。一旦被標記,賬戶可能會受到限制或刪除。
  2. 網路欺凌和騷擾:NLP 模型會觀察對話語氣。Transformer 或迴圈網路會分析評論或私信的情緒和語境。該系統通常會使用上下文嵌入來嘗試區分惡意內容和善意的玩笑。當評論聽起來帶有辱罵性時,它可以被自動過濾。Instagram 擁有限制或隱藏詞語等功能,利用人工智慧來防止欺凌。這些語言過濾器會持續執行,以阻止仇恨言論和騷擾。
  3. 社羣誠信:機器學習還會精簡推薦圖譜:包含大量使用者舉報或違規歷史的帖子可能會根據內容誠信訊號被降級。例如,在檢索過程中,Instagram 會應用業務規則從候選人中刪除令人反感的帖子。在主動模式下,在計算出主要排名分數後,系統會應用最終的重新排名過濾器,刪除或降級被誠信檢查標記的帖子。

Instagram 的人工智慧將自動過濾器與人工申訴相結合,確保了安全性和真實性。如果評論看起來具有冒犯性,它可以提示使用者“你確定嗎?”。總的來說,這些系統每天會阻止數百萬次垃圾資訊或仇恨互動,保護使用者並維護平臺的健康。

人工智慧對抗網路欺凌和垃圾郵件

Source: Instagram

Instagram使用的技術摘要

模型/技術 功能描述 典型案例/備註
CNN影像分類器 用於二元或多分類影像識別(如”安全內容”、”裸露內容”、”暴力內容”分類) 基於ResNet、Inception、EfficientNet等架構,針對Instagram資料集進行微調最佳化
目標檢測模型 識別影像/影片中的違禁物品或文字內容 Faster R-CNN(高精度)、YOLO(即時檢測)、DETR(端到端檢測)等主流框架
光學字元識別(OCR) 提取模因圖/截圖中的文字內容用於稽覈 Rosetta技術方案:Faster R-CNN檢測框 + CNN+LSTM多語言識別架構
NLP Transformer模型 分析標題/評論中的仇恨言論和垃圾資訊 BERT(基礎架構)、RoBERTa(最佳化版)、XLM(跨語言模型)等支援多語言稽覈
雙塔神經網路 支撐資訊流和Explore推薦的大規模內容檢索 採用FAISS(高效相似性搜尋庫)實現快速近似最近鄰匹配
多工深度網路 預測點贊/評論/觀看時長等互動指標,實現個性化內容排序 Instagram內容管道中,大型多層感知機(MLP)作為二級排序器
自監督學習(SEER) 從數十億無標註影像中學習通用視覺表徵 Meta開發的超大規模視覺模型,引數量超過10億,支援跨領域遷移學習

AI稽覈的優勢是什麼?

對於擁有數百萬甚至數十億使用者、每天生成海量內容的平臺來說,手動內容稽覈並不可行。但藉助 AI,可以

  1. 將稽覈範圍擴大到每天數十億條帖子。
  2. 快速刪除有害內容,通常在有人舉報之前就已刪除。
  3. 提高安全性,打造更具支援性的社羣。
  4. 個性化體驗,保持內容的相關性和吸引力。

這些系統使 Instagram 能夠處理人類無法獨自處理的內容量,從而提高使用者和平臺的質量。

AI稽覈的挑戰和侷限性

即使是最先進的 AI 系統也並非完美無缺。Instagram 的稽覈面臨著一些挑戰,例如:

  1. 誤報/假陽性:藝術或教育性裸露內容被錯誤地標記為違規。
  2. 漏報/假陰性:由於上下文或故意迴避(例如使用更改的拼寫或扭曲的影像)而導致有害內容漏網。
  3. 偏見與公平:模型可能反映人類的標籤偏見,導致不同語言、文化或社群的稽覈不均衡。
  4. 透明度:使用者通常無法完全理解稽覈決策的制定過程,從而導致使用者對“影子禁令”或帖子被刪除感到沮喪。

小結

Instagram 的人工智慧是計算機視覺、自然語言處理和大規模推薦模型的綜合體。採用 ResNet、EfficientNet、YOLO 和 Faster R-CNN 等架構的先進 CNN 可處理影像/影片內容。先進的 OCR(Rosetta)可從表情包中提取文字以標記隱藏的違規內容。同時,深度自然語言處理 (NLP) 模型可解析使用者文字以識別仇恨言論或垃圾資訊。另一方面,用於 Two Tower 檢索和多工排名網路的神經推薦系統不斷學習使用者行為,從而定製每個動態。這種強大的人工智慧驅動方法使 Instagram 能夠在全球範圍內進行稽覈和個性化。儘管偏見和可解釋性等問題仍然存在,但這些模型對於確保 Instagram 的安全、吸引力以及與數十億使用者的相關性至關重要。

常見問題

Q1. Instagram 如何利用人工智慧進行內容稽覈?

A. Instagram 使用 CNN、OCR(Rosetta)和 NLP Transformer 等人工智慧模型,在使用者舉報之前檢測並刪除仇恨言論、裸露、暴力和垃圾內容。這些系統會自動標記、遮蔽或傳送內容進行人工稽覈。

Q2. Instagram 的推薦系統由哪些人工智慧模型驅動?

A. Instagram 的動態和“探索”標籤依靠雙塔神經網路進行檢索,並依靠多工深度網路進行排名。這些模型根據每個使用者的行為、興趣和參與模式,對動態進行個性化設定。

Q3. Instagram 在人工智慧稽覈方面面臨哪些挑戰?

A. 關鍵問題包括誤報、跨語言或文化的偏見以及稽覈決策的透明度有限,導致使用者沮喪和偶爾的“影子禁令”投訴。

評論留言