Instagram如何利用AI进行内容审核?

Instagram如何利用AI进行内容审核?

文章目录

  • Instagram上的AI内容审核
  • 1. 图像/视频分析:
  • 2. 光学字符识别 (Rosetta):
  • 3. 语言理解 (NLP):
  • 个性化与用户体验提升
  • 人工智能对抗网络欺凌和垃圾邮件
  • Instagram使用的技术摘要
  • AI审核的优势是什么?
  • AI审核的挑战和局限性
  • 小结
  • 常见问题

Instagram如何利用AI进行内容审核?

Instagram 广泛使用人工智能 (AI) 进行内容过滤和审核,以维护安全积极的用户体验。这些 AI 系统会自动检测并删除违反 Instagram 社区准则的内容,例如仇恨言论、欺凌、裸露、暴力和垃圾信息,并在用户举报之前进行处理。这一过程结合了机器学习模型、自然语言处理和卷积神经网络等计算机视觉技术。本文将尝试揭示 Instagram 在维持其平台积极友好的用户体验的同时,背后的机制。

Instagram上的AI内容审核

Instagram 的 AI 系统会自动检测并删除违反其社区准则的内容,例如仇恨言论、欺凌、裸露、暴力画面和垃圾信息,而且通常在用户举报之前就会执行。

1. 图像/视频分析:

Instagram 使用深度 CNN 分类器来识别禁用视觉内容。例如,它在大型、带标签的“不适当图片与安全图片”数据集上训练卷积网络(通常是 ResNet 风格的主干网络)。它还使用目标检测模型(像 YOLO 这样的单阶段检测器或像 Faster R-CNN 这样的双阶段检测器)来定位露骨内容。Instagram 的母公司 Meta 指出,当准确性至关重要时,它可以使用 YOLO 进行快速实时视频扫描,并使用例如 ResNet 或 ShuffleNet 主干网络的 Faster R-CNN。实际上,如果图像的像素与裸体、武器、图像和暴力图像的模式匹配,CNN 就会对其进行标记。

2. 光学字符识别 (Rosetta):

许多帖子会嵌入文本,例如表情包、屏幕截图和带标题的图片,因此 Instagram 使用专门的 OCR 流程(Meta 的 Rosetta 系统)来提取叠加的文本。然后,Rosetta 运行一个两阶段视觉模型。首先是一个 Faster R-CNN 变体,用于检测矩形文本区域;然后是一个基于 Resnet-18 且带有 CTC(序列)损失的 CNN,用于读取每个单词。

例如,一个表情包“1 个赞 = 1 个祈祷”会被检测并转录。这段文本会被输入到审核引擎中。Rosetta 的 CNN+LSTM 识别器基于合成和真实的多语言数据进行训练,使 Instagram 能够捕捉隐藏在图片中的仇恨言论或垃圾信息。

3. 语言理解 (NLP):

图片说明、评论和消息由自然语言模型处理。Instagram 应用算法(通常是基于 Transformer 的文本分类器和 RNN)来根据社区准则对内容进行评分。

例如,评论会被使用学习到的嵌入或类似 BERT 的模型进行矢量化,然后输入到垃圾信息/仇恨分类器中。通过学习文本中的模式,可以识别辱骂性语言、骚扰、亵渎或仇恨内容。虽然具体的内部模型是专有的,但 Meta 已证明其使用最先进的 NLP 架构来大规模审核数十种语言。在实践中,根据置信度,由视觉或 NLP 子系统标记的帖子会被自动屏蔽或送交人工审核。

这种 AI-人类混合方法将 AI 的速度和规模与人类的细致决策相结合,然后利用来自人类审核员的反馈来重新训练模型,使系统随着时间的推移变得更加智能。

AI-人类混合方法

Source: Spectrumlabsai

个性化与用户体验提升

Instagram 的动态、“探索”标签和 Reels 依靠机器学习排名模型来个性化每位用户的体验。该系统是一个多阶段推荐系统:

首先,它从关注的账号、热门标签、相似用户的帖子等中检索大量候选帖子。然后,通过深度学习对它们进行排名。在检索过程中,Instagram 使用双塔神经网络,一个“塔”处理用户特征,例如人口统计、历史记录、兴趣;另一个“塔”处理媒体特征,例如帖子元数据、内容嵌入。

每个“塔”通常是一个前馈网络,通常从类似 Word2Vec 的 ID 嵌入开始,学习紧凑的用户/项目向量。训练目标是使用户与项目交互时,用户和项目的嵌入接近。在服务时,用户的“塔”和近似最近邻 (ANN) 索引(例如,使用 FAISS)会生成数千个候选帖子进行排名。这种双塔方法具有高度可缓存性,并允许从数十亿个项目中实时检索。

检索到候选帖子后,Instagram 会应用两阶段深度排名模型。第一阶段的排名器是一个轻量级神经网络,它会对每个用户的数千条帖子进行评分(通常从更重的模型中提取知识)。第二阶段是一个更重的多任务多标签神经网络 (MTML),它会选取排名前 100 位的候选帖子并预测详细的参与概率(点击、点赞、评论、观看等)。这个 MTML 模型是一个通过反向传播训练的前馈深度网络,它可以同时提取丰富的特征,例如用户兴趣、帖子内容向量、过去的互动指标等以及多个概率。简而言之,深度神经网络负责帖子的检索和最终排名,从而使 Instagram 能够根据每个用户的偏好对动态进行排序。这种个性化设置通过为每个用户展示最相关的内容来保持较高的参与度。

用户社交行为图形

Source: Daffodil

人工智能对抗网络欺凌和垃圾邮件

除了内容和排名之外,Instagram 还应用人工智能来打击垃圾邮件机器人和骚扰。例如,

  1. 垃圾邮件检测:发送大量私信或评论(例如网络钓鱼诈骗)的账户会被模式学习模型标记。Instagram 可以根据发帖频率、消息相似度、点击率和账户元数据等特征,训练集成模型或神经网络等二分类器。任何非自然模式,例如自动私信、重复链接或“点赞”方案,都会触发反垃圾邮件过滤器。Rosetta 的 OCR 技术也在这方面有所帮助;它可以读取图片/表情包中的垃圾文字。一旦被标记,账户可能会受到限制或删除。
  2. 网络欺凌和骚扰:NLP 模型会观察对话语气。Transformer 或循环网络会分析评论或私信的情绪和语境。该系统通常会使用上下文嵌入来尝试区分恶意内容和善意的玩笑。当评论听起来带有辱骂性时,它可以被自动过滤。Instagram 拥有限制或隐藏词语等功能,利用人工智能来防止欺凌。这些语言过滤器会持续运行,以阻止仇恨言论和骚扰。
  3. 社区诚信:机器学习还会精简推荐图谱:包含大量用户举报或违规历史的帖子可能会根据内容诚信信号被降级。例如,在检索过程中,Instagram 会应用业务规则从候选人中删除令人反感的帖子。在主动模式下,在计算出主要排名分数后,系统会应用最终的重新排名过滤器,删除或降级被诚信检查标记的帖子。

Instagram 的人工智能将自动过滤器与人工申诉相结合,确保了安全性和真实性。如果评论看起来具有冒犯性,它可以提示用户“你确定吗?”。总的来说,这些系统每天会阻止数百万次垃圾信息或仇恨互动,保护用户并维护平台的健康。

人工智能对抗网络欺凌和垃圾邮件

Source: Instagram

Instagram使用的技术摘要

模型/技术 功能描述 典型案例/备注
CNN图像分类器 用于二元或多分类图像识别(如”安全内容”、”裸露内容”、”暴力内容”分类) 基于ResNet、Inception、EfficientNet等架构,针对Instagram数据集进行微调优化
目标检测模型 识别图像/视频中的违禁物品或文字内容 Faster R-CNN(高精度)、YOLO(实时检测)、DETR(端到端检测)等主流框架
光学字符识别(OCR) 提取模因图/截图中的文字内容用于审核 Rosetta技术方案:Faster R-CNN检测框 + CNN+LSTM多语言识别架构
NLP Transformer模型 分析标题/评论中的仇恨言论和垃圾信息 BERT(基础架构)、RoBERTa(优化版)、XLM(跨语言模型)等支持多语言审核
双塔神经网络 支撑信息流和Explore推荐的大规模内容检索 采用FAISS(高效相似性搜索库)实现快速近似最近邻匹配
多任务深度网络 预测点赞/评论/观看时长等互动指标,实现个性化内容排序 Instagram内容管道中,大型多层感知机(MLP)作为二级排序器
自监督学习(SEER) 从数十亿无标注图像中学习通用视觉表征 Meta开发的超大规模视觉模型,参数量超过10亿,支持跨领域迁移学习

AI审核的优势是什么?

对于拥有数百万甚至数十亿用户、每天生成海量内容的平台来说,手动内容审核并不可行。但借助 AI,可以

  1. 将审核范围扩大到每天数十亿条帖子。
  2. 快速删除有害内容,通常在有人举报之前就已删除。
  3. 提高安全性,打造更具支持性的社区。
  4. 个性化体验,保持内容的相关性和吸引力。

这些系统使 Instagram 能够处理人类无法独自处理的内容量,从而提高用户和平台的质量。

AI审核的挑战和局限性

即使是最先进的 AI 系统也并非完美无缺。Instagram 的审核面临着一些挑战,例如:

  1. 误报/假阳性:艺术或教育性裸露内容被错误地标记为违规。
  2. 漏报/假阴性:由于上下文或故意回避(例如使用更改的拼写或扭曲的图像)而导致有害内容漏网。
  3. 偏见与公平:模型可能反映人类的标签偏见,导致不同语言、文化或社群的审核不均衡。
  4. 透明度:用户通常无法完全理解审核决策的制定过程,从而导致用户对“影子禁令”或帖子被删除感到沮丧。

小结

Instagram 的人工智能是计算机视觉、自然语言处理和大规模推荐模型的综合体。采用 ResNet、EfficientNet、YOLO 和 Faster R-CNN 等架构的先进 CNN 可处理图像/视频内容。先进的 OCR(Rosetta)可从表情包中提取文本以标记隐藏的违规内容。同时,深度自然语言处理 (NLP) 模型可解析用户文本以识别仇恨言论或垃圾信息。另一方面,用于 Two Tower 检索和多任务排名网络的神经推荐系统不断学习用户行为,从而定制每个动态。这种强大的人工智能驱动方法使 Instagram 能够在全球范围内进行审核和个性化。尽管偏见和可解释性等问题仍然存在,但这些模型对于确保 Instagram 的安全、吸引力以及与数十亿用户的相关性至关重要。

常见问题

Q1. Instagram 如何利用人工智能进行内容审核?

A. Instagram 使用 CNN、OCR(Rosetta)和 NLP Transformer 等人工智能模型,在用户举报之前检测并删除仇恨言论、裸露、暴力和垃圾内容。这些系统会自动标记、屏蔽或发送内容进行人工审核。

Q2. Instagram 的推荐系统由哪些人工智能模型驱动?

A. Instagram 的动态和“探索”标签依靠双塔神经网络进行检索,并依靠多任务深度网络进行排名。这些模型根据每个用户的行为、兴趣和参与模式,对动态进行个性化设置。

Q3. Instagram 在人工智能审核方面面临哪些挑战?

A. 关键问题包括误报、跨语言或文化的偏见以及审核决策的透明度有限,导致用户沮丧和偶尔的“影子禁令”投诉。

评论留言

闪电侠

(工作日 10:00 - 18:30 为您服务)

2025-12-14 20:36:40

您好,无论是售前、售后、意见建议……均可通过联系工单与我们取得联系。

您也可选择聊天工具与我们即时沟通或点击查看:

您的工单我们已经收到,我们将会尽快跟您联系!
取消
选择聊天工具: