news 2026/4/18 7:24:41

1. 假新闻检测 - 《Modality Perception Learning-Based Determinative Factor Discovery ...》

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
1. 假新闻检测 - 《Modality Perception Learning-Based Determinative Factor Discovery ...》

前言

本文阅读论文《Modality Perception Learning-Based Determinative Factor Discovery for MultimodalFake News Detection》。虚假新闻通常依赖夸张的语言风格、篡改的图像、不一致的多模态上下文等特征。虚假新闻检测应遵循“逻辑与”原则,即便大部分内容合理,只要存在少量不合理内容,即可判定为虚假。

核心内容细节
问题现有方法关注于多模态的一致性和设计复杂的特征提取器,而忽略了模态间的语义差异。例如下图中,文本与图像在表面上一致,但隐含夸张文本与篡改图像。
方法首先利用CLIP预训练编码器与模态特定编码器,分别提取模态一致与模态特定特征,然后进行多层次跨模态融合,最后根据模态异质性分数动态加权不同特征。
贡献设计双重编码模块,融合CLIP编码与模态特定编码;引入可学习的记忆信息,增强特征表示能力;构建多层次跨模态融合模块,深入理解模态间复杂关联;提出模态感知学习模块,根据模态分布差异自适应加权特征。


文章目录

  • 前言
  • 一、现有方法
  • 二、本文方法
  • 总结

一、现有方法

分类方法
单模态基于文本的检测:关注假新闻的语言特征,如夸张、煽动性。
基于视觉的检测:关注图像是否被篡改、是否具有误导性。
多模态多模态信息融合方法:分别提取文本和图像特征,再进行融合。
模态相似性度量方法:通过衡量文本与图像之间的语义一致性来辅助检测。
基于图神经网络与外部知识的方法:引入知识图谱或社交网络信息增强表示。

二、本文方法

  1. 对于某一特征,用 CNN 提取模态特定的特征,用 CLIP 提取一致特征,然后拼接。其中,文本编码器是 CNN + 池化,图像编码器是 ResNet-50;
  2. 引入可学习的记忆向量以提取不同模态特征真假模式,并进一步与提取的特征拼接;
  3. 使用多头自注意力增强每个模态自身的特征表示;
  4. 模仿人类先看图片辅助理解文字的习惯,以图像特征作为 Q,文本特征作为 K 和 V,通过跨模态注意力让图像信息增强文本信息f t v f_{tv}ftv。然后,模仿人类反复对照图文、捕捉深层线索的行为,进一步增强文本信息,同时使用视觉增强的文本特征作为 Q 增强原始图像特征;
  5. 用VAE将文本特征和图像特征分别映射到潜在空间,然后计算二者的 KL 散度,并用 sigmoid 将其映射到 0-1 区间。h hh越大,图文越不一致,将h hh作为多模态融合特征权重,1 − h 1-h1h作为单模态特征权重;
  6. 将加权后的四个特征拼接起来,并送入一个全连接层分类器进行真假二分类。

总结

文章的动机有点以结果为导向。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 5:42:15

大规模语言模型在精准医疗方案生成中的应用

大规模语言模型在精准医疗方案生成中的应用 关键词:大规模语言模型、精准医疗方案、医疗数据处理、模型应用、医学知识推理 摘要:本文聚焦于大规模语言模型在精准医疗方案生成中的应用。首先介绍了研究的背景、目的、预期读者、文档结构及相关术语。详细阐述了大规模语言模型…

作者头像 李华
网站建设 2026/4/18 5:43:21

iOS 26.3 公测版来了:苹果的“假期惊喜”更新,表面小,暗地里很狠

我有一支技术全面、经验丰富的小型团队,专注高效交付中等规模外包项目,有需要外包项目的可以联系我时间来到 12 月中旬。大多数人不是在盘算假期购物,就是终于准备从工作里喘口气。按惯例,苹果这个时候通常很安静——然而最近&…

作者头像 李华
网站建设 2026/4/18 10:08:45

XML与XSD文件验证:路径问题与解决方案

引言 在处理XML文档时,XSD(XML Schema Definition)文件作为XML的约束性文件,确保XML文档的结构和内容符合预定义的规范。然而,当涉及到多个XSD文件的引用和验证时,可能会遇到一些意想不到的困难。本文将通过一个实际的案例探讨XML文件在验证过程中遇到的路径问题,并提供…

作者头像 李华
网站建设 2026/4/16 17:17:32

RESTful API 设计的最佳实践

在设计RESTful API时,我们经常会遇到如何优化数据获取的问题,特别是在处理相关实体数据时。让我们通过一个实际的例子来探讨如何实现RESTful API的最佳实践。 背景 假设我们有一个博客系统,API的基本结构如下: GET /api/v1/posts/1/ {"id": 1,"title&quo…

作者头像 李华
网站建设 2026/4/18 10:08:42

解密CatBoost学习率参数

在机器学习和数据科学领域,选择合适的模型超参数是提升模型性能的关键步骤之一。CatBoost,作为一个强大的梯度提升决策树(GBDT)框架,其学习率(learning rate)参数尤为重要。本文将深入探讨CatBoost的学习率参数设置,并通过实际案例展示其在Amazon SageMaker中的应用。 …

作者头像 李华