MultiTrust：首个综合统一的多模态信任度基准（下）

MultiTrust：首个综合统一的多模态信任度基准（下）

news/2024/10/3 2:21:15/文章来源:https://blog.csdn.net/robinfang2019/article/details/139671959

2 实验

2.1 实验设计

实验设计基于对MLLMs可信度的全面理解，包括真实性、安全性、鲁棒性、公平性和隐私性五个主要方面。这些方面共同构成了一个综合框架，用于评估模型在防止不良结果和确保对用户社会影响的可靠性。

真实性（Truthfulness）：评估MLLMs的输出是否与客观事实一致，重点在于信息的准确性。包括基本世界理解、高级认知推理、指令增强的VQA和视觉辅助的QA任务。
安全性（Safety）：保证MLLMs的响应不会引起意外后果，如无意中的伤害或非法行为。包括对NSFW图像描述、风险识别、有害内容生成和模型越狱的评估。
鲁棒性（Robustness）：评估MLLMs在面对分布偏移或输入扰动时的一致性和抵抗力。包括对艺术风格图像的描述、传感器风格图像的VQA和对OOD文本的情感分析。
公平性（Fairness）：确定MLLMs的输出是否不受不公平或歧视性结果的影响，这些结果可能对任何用户群体不利。
隐私性（Privacy）：评估MLLMs保护个人数据不受未经授权请求的能力。

2.2 数据集

2.2.1 数据集的构建

为了全面评估MLLMs在可信度方面的性能，设计并构建了多个数据集，以支持不同类型的任务。这些数据集包括：

基本世界理解：评估模型对物体存在判断、属性识别、场景分析、视觉定位和光学字符识别（OCR）等基本感知能力。
高级认知推理：涉及空间-时间推理、属性比较、常识推理和专业技能，如数学问题解答、代码解读和基于OCR的中文翻译。
指令增强的VQA：研究者通过提供不同复杂度的指令提示，来评估模型对问题的理解及其回答的准确性。
视觉辅助的QA：在文本输入的基础上，提供与问题答案正相关的图像，以评估图像信息对模型性能的影响。
安全性任务：包括对不宜在工作场所展示（NSFW）的图像描述、风险识别、有害内容生成和模型越狱（jailbreaking）的评估。
鲁棒性任务：评估模型在面对艺术风格图像、传感器风格图像和情感分析任务中的分布外（OOD）数据时的表现。
公平性任务：评估模型在生成与特定人群相关的刻板印象内容时的表现，以及它们对不同人群的偏见和偏好。
隐私性任务：评估模型在识别图像中的隐私信息和在对话中保护个人身份信息（PII）的能力。

2.2.2 数据集和任务的实施

数据集来源：部分数据集基于现有的文本、图像和多模态数据集进行改进，而其他数据集则是从头开始构建，通过互联网收集图像或使用算法合成图像。
任务执行：为每个任务设计了详细的执行方案，包括模型输入、预期输出和评估标准。
模型评估：使用统一的接口和模块化设计，对21个现代MLLMs进行评估，确保评估的标准化和可扩展性。

2.3 实验实施

实验实施部分是论文中用于评估MLLMs可信度的关键环节。通过一系列标准化的实验流程，对MLLMs在不同任务和场景下的表现进行了全面的测试和分析。

2.3.1 实验环境搭建

模型部署：收集了21个现代MLLMs，包括4个专有模型和17个开源模型。这些模型通过统一的接口进行部署，确保了实验的一致性和可比性。
数据集准备：研究者构建了多个数据集，包括改进现有的多模态数据集和创建新的数据集，以支持不同类型的任务和评估需求。

2.3.2 实验流程

任务执行：MLLMs在32个不同的任务上进行了评估，这些任务涵盖了从基本感知能力到高级认知推理的多个方面。
输入输出规范：为了确保实验的标准化，研究者为每个任务设计了明确的输入和输出规范。例如，在视觉问答（VQA）任务中，模型需要根据输入的图像和问题提供准确的答案。

2.3.3 评估方法

准确性评估：在许多任务中，准确性是主要的评估指标。研究者使用GPT-4或其他分类器来评估模型输出的正确性。
拒绝回答率（RtA）：在安全性任务中，模型拒绝回答不当或有害查询的能力也是一个重要的评估指标。

2.3.4 实验的可重复性

参数设置：为了确保实验结果的可重复性，为所有任务设置了统一的参数，如温度（temperature）和样本（sample）参数。
实验日志：记录了实验过程中的所有关键信息，包括模型版本、数据集细节和实验日期。

2.4 实验结果

实验结果揭示了MLLMs在多个可信度维度上的表现，包括真实性、安全性、鲁棒性、公平性和隐私性。通过对21个现代MLLMs进行广泛实验，得出了一系列关键发现。

2.4.1 真实性结果

MLLMs在基本感知任务上表现良好，但在更细粒度的任务上性能下降，显示出模型在细粒度感知能力上的局限性。
专有模型在抵抗误导性输入方面表现优于开源模型，显示出较低的易受干扰性。

2.4.2 安全性结果

开源MLLMs在拒绝提供有害内容方面表现不佳，而专有模型如GPT-4-Vision和Claude3在安全性方面表现更好，具有较高的拒绝回答率（RtA）和较低的毒性得分。
MLLMs在识别图像中的风险对象和分析相关风险方面表现不一，表明它们对与风险对象相关的安全风险意识不足。

2.4.3 鲁棒性结果

MLLMs在处理艺术风格图像的描述任务中表现出良好的适应性，但在面对来自不同传感器的图像时，其鲁棒性仍有待提高。
在对抗性攻击下，所有MLLMs都显示出对敌意样本的脆弱性，特别是在未针对性攻击下，模型的性能显著下降。

2.4.4 公平性结果

MLLMs在生成与特定人群相关的刻板印象内容时表现出不同程度的敏感性，这可能与模型训练阶段的校准有关。
在评估模型对刻板印象的认同或反对时，模型表现出对某些刻板印象类别的更高认同率，这与社会对这些类别的关注程度相对应。

2.4.5 隐私性结果

MLLMs在图像中识别隐私信息的能力与其基本感知能力相关，但在需要更复杂推理的场景中，隐私意识显著下降。
在对话中，MLLMs倾向于在图像提示下泄露个人信息，这表明多模态输入可能会干扰模型遵循文本指令和保护隐私的能力。

3 关键发现

通过广泛的实验，发现了MLLMs在可信度方面的一些重要问题和风险。这些问题和风险涉及模型在多模态场景下的表现，以及它们在面对复杂输入时的脆弱性。

3.1 专有模型与开源模型的比较

专有模型的可信度：专有模型如GPT-4V和Claude3在多个方面表现出较高的可信度，这归功于它们在对齐、安全防护等方面的努力。
开源模型的挑战：尽管开源MLLMs在多个通用基准测试中的表现接近或甚至超过了专有模型，但在可信度方面仍存在显著的脆弱性和问题。

3.2 多模态训练和推理的影响

多模态训练的风险：多模态训练和在推理中引入图像极大地危及MLLMs的可信度，表现在模型性能和对齐的妥协，以及不相关图像引起的不稳定行为。
跨模态影响：相关视觉上下文可能会更直接地影响模型性能，有时有利于完成任务，但更常见的是导致意外行为和加剧内部风险。

3.3 模型架构和训练的影响

模型架构和训练：改进的架构（如新的视觉编码器、对齐的基础LLM）和训练范式（如使用GPT-4V数据进行监督微调、RLHF）可以在一定程度上积极影响模型的可信度。
技术局限性：现有技术不足以全面保证可信度，例如，独特视觉编码器的鲁棒性可能在包含在替代模型中时被抵消。

3.4 社会影响和风险

社会风险：MLLMs的可信度问题可能对社会产生深远的风险，如传播错误信息、泄露隐私、加剧社会不平等和违反个人权利。
风险管理：研究者强调了谨慎使用MLLMs的必要性，以防止其潜在的负面影响。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.xdnf.cn/news/1451036.html

如若内容造成侵权/违法违规/事实不符，请联系一条长河网进行投诉反馈，一经查实，立即删除！

相关文章

minIo ubuntu单节点部署

minIo ubuntu单节点部署

资源准备 minio二进制包下载地址:https://dl.min.io/server/minio/release/linux-amd64/minio ubuntu-单节点部署选择一台ubuntu18.04机器10.253.9.41、intel 或者 amd 64位处理器上传minio到~目录 sudo cp minio /usr/local/bin/ sudo chmod x /usr/local/bin/minio 设…

阅读更多...

变压器空载合闸励磁涌流的Simulink仿真

变压器空载合闸励磁涌流的Simulink仿真

利用图 1所示的仿真模型分析三相变压器空载合闸过程时, 设置三相断路器模块的切换时间为0s,仿真时间为 0.5s, 仿真算法为 ode23t 。三相断路器模块 QF2、故障模块 Fault1 和 Fault2 在仿真中均不动作（设置其切换时间大于仿真时间即可）。为了观察合闸时…

阅读更多...

Java接口实现与类继承

Java接口实现与类继承

学习初期发现接口实现与类继承很像，随着学习深入发现它们之间的联系与区别，整理如下： 经实验发现，实现接口的类中含有接口中的所有属性和方法，继承父类的子类中也含有父类中所有的属性和方法，可以说接口实…

阅读更多...

车牌识别（附源代码）

车牌识别（附源代码）

完整项目已上传至github:End-to-end-for-chinese-plate-recognition/License-plate-recognition at master duanshengliu/End-to-end-for-chinese-plate-recognition GitHub 整体思路： 1.利用u-net图像分割得到二值化图像 2.再使用cv2进行边缘检测获得车牌区域坐…

阅读更多...

11.1 Go 标准库的组成

11.1 Go 标准库的组成

💝💝💝欢迎莅临我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:「stormsha的主页」…

阅读更多...

内网穿透方法有哪些？路由器端口映射外网和软件方案步骤

内网穿透方法有哪些？路由器端口映射外网和软件方案步骤

公网IP和私有IP不能互相通讯。我们通常在局域网内部署服务器和应用，当需要将本地服务提供到互联网外网连接访问时，由于本地服务器本身并无公网IP，就无法实现。这时候就需要内网穿透技术，即内网映射，内网IP端口映射到外…

阅读更多...

iOS 18 照片应用程序增加了新分类用于查找二维码、收据、插图等

iOS 18 照片应用程序增加了新分类用于查找二维码、收据、插图等

苹果照片应用苹果在iOS 18的照片应用中引入了全新的设计，将图库和推荐部分合并为一个更集成的多合一视图。重新设计的实用工具部分经过全面改造，使得查找不同类型的图片更加容易。实用工具在iOS 17中，照片应用的实用工具部分只包括导入…

阅读更多...

【代码随想录】【算法训练营】【第36天】[452]用最少数量的箭引爆气球 [435]无重叠区间 [763]划分字母区间

【代码随想录】【算法训练营】【第36天】[452]用最少数量的箭引爆气球 [435]无重叠区间 [763]划分字母区间

前言思路及算法思维，指路代码随想录。题目来自 LeetCode。 day 36，周三，最难坚持的一天~ 题目详情 [452] 用最少数量的箭引爆气球题目描述 452 用最少数量的箭引爆气球解题思路前提：区间可能重叠思路：…

阅读更多...

自动控制：滑模控制(Sliding Mode Control, SMC)

自动控制：滑模控制(Sliding Mode Control, SMC)

自动控制：滑模控制(Sliding Mode Control, SMC) 滑模控制（Sliding Mode Control, SMC）是一种在处理非线性系统时非常有效的控制技术。它通过驱动系统状态达到并保持在特定的滑模面附近，来实现控制目标。本文将介绍滑模控制的基本…

阅读更多...

潞晨训推一体机，画出大模型到企业的一条龙路线图

潞晨训推一体机，画出大模型到企业的一条龙路线图

最近跟一位企业的CIO交流，对方关于大模型的认知让我惊呆了，他说，“听说做私域大模型要两千万的软件投入和两千万的算力投入，我们公司没有这个预算”。于是我问道：“那如果按照你们公司的数据基础和业务场景&#xff0…

阅读更多...

功能测试之单模块测试----轮播图、登录、注册

功能测试之单模块测试----轮播图、登录、注册

单功能怎么测？ 需求分析拆解测试点编写用例 1.轮播图 （1）需求分析位置：后台--页面--广告管理---广告列表(搜索index页面增加广告位2) 操作完成后需要点击admin---更新缓存,前台页面刷新生效 （2）拆解…

阅读更多...

感受光子芯片中试线，如何点亮未来计算与通信的革命之路（2024青岛智能装备与通信技术展）

感受光子芯片中试线，如何点亮未来计算与通信的革命之路（2024青岛智能装备与通信技术展）

光子芯片中试线：点亮未来计算与通信的革命之路在新一代信息技术的浪潮中，光子芯片以其低能耗、高速度的特点备受瞩目。首条光子芯片中试线的建立，标志着我国在光电子领域的重大突破，同时也为即将到来的量子计算时代奠定了坚实基…

阅读更多...

Fantasy Icons Megapack（梦幻盔甲宝石图标魔法道具图标集）

Fantasy Icons Megapack（梦幻盔甲宝石图标魔法道具图标集）

所有图标都具备高质量，并以专业水平实施。任何幻想风格游戏的上佳选择。 - 可更新的超级资源包； - 每个图标的大小均为 256x256 像素 (PNG)； - 总计 2672 个独一无二的图标； - 所有图标均具有透明背景。超级资源包内置&#xff1…

阅读更多...

Linux常⽤服务器构建-samba

Linux常⽤服务器构建-samba

目录 1. 介绍 2. 安装 3. 配置 3.1 创建存放共享⽂件的路径 3.2 创建samba账户 4 重启samba 5. 访问共享⽂件 5.1 mac下访问⽅式 5.2 windows下访问⽅式 1. 介绍 Samba 是在 Linux 和 UNIX 系统上实现 SMB 协议的⼀个免费软件，能够完成在 windows 、 mac 操作系统…

阅读更多...

卡塔尔.巴林：海外媒体投放-宣发.发稿效果显著提高

卡塔尔.巴林：海外媒体投放-宣发.发稿效果显著提高

引言卡塔尔和巴林两国积极采取措施，通过海外媒体投放和宣发，将本国的商业新闻和相关信息传达给更广泛的受众。在这一过程中，卡塔尔新闻网、巴林商业新闻和摩纳哥新闻网等媒体起到了关键作用。通过投放新闻稿，这些国际化的媒体平…

阅读更多...

力扣148. 排序链表

力扣148. 排序链表

给你链表的头结点 head ，请将其按升序排列并返回排序后的链表。示例 1： 输入：head [4,2,1,3] 输出：[1,2,3,4] 示例 2： 输入：head [-1,5,3,4,0] 输出：[-1,0,3,4,5] 示例 3&…

阅读更多...

人工气候老化曝露暴晒风电叶片用涂层涂料的老化耐候性能研究

人工气候老化曝露暴晒风电叶片用涂层涂料的老化耐候性能研究

关键词：太阳光模拟器、紫外光模拟器、高低温试验箱、太阳辐射光照测试系统通过研究风电叶片用氟碳涂料老化性能评价方法，对制定适合我国国情的风电叶片涂料检测方法和技术评价指标具有重要意义。 1 实验部分 1.1 试验材料收集国内外三家知名风电…

阅读更多...

谷粒商城实战(036 k8s集群学习2-集群的安装)

谷粒商城实战(036 k8s集群学习2-集群的安装)

Java项目《谷粒商城》架构师级Java项目实战，对标阿里P6-P7，全网最强总时长 104:45:00 共408P 此文章包含第343p-第p345的内容 k8s 集群安装 kubectl --》命令行操作要进入服务器而且对一些不懂代码的产品经理和运维人员不太友好所以我们使用可视化…

阅读更多...

（三十九）Vue之集中式的状态管理机制Vuex

（三十九）Vue之集中式的状态管理机制Vuex

目录概念vuex的核心概念State（状态）Getters（获取器）Mutations（突变）Actions（动作） 搭建vuex环境基本使用getters的使用上一篇：（三十八）Vue之插槽…

阅读更多...

记Windows环境下JDK安装配置

记Windows环境下JDK安装配置

写在文章开头这是笔者非常早期接触Java时写的文章，为方便每次系统重装时能够快速完成JDK解压版安装配置遂用此文记录了一下整个过程。 Hi，我是 sharkChili ，是个不断在硬核技术上作死的 java coder ，是 CSDN的博客专家 &#x…

阅读更多...

最新文章