探索大型语言模型(LLMs)能否在不泄露私人信息的情况下联合其他大型语言模型共同解决问题

概述

谷歌的 Gemini Ultra(2023 年)和 OpenAI 的 GPT-4 (2023 年)等大规模语言模型在许多任务中都表现出了令人印象深刻的性能。然而,这些模型不仅推理成本高昂,而且运行于数据中心,而数据中心并非本地环境,无法获得私人数据。另一方面,可以在私人环境中运行的模型,如 Gemini Nano,可以在用户的设备上运行,但其性能有限。

为了在私密环境中实现最先进的性能,需要本地模型具有隐私保护机制,可以在不共享敏感数据的情况下向远程模型发送查询。在传统的级联系统中,人们已经研究了较小、能力较弱的模型向较大、能力较强的模型发送查询的机制,但尚未研究保护隐私的机制。在当前的级联系统中,使用大型模型的决定通常基于查询是否可以由较小的模型独立处理。

如果决定在大型模型中进行处理,则包含私人数据的查询会被原封不动地传输。这会造成隐私威胁,例如敏感数据泄露或转发的查询被纳入远程系统的训练数据集。

本文首次提出了级联系统的隐私保护方法。与传统的级联系统不同,本文提出的方法假定本地模型始终保持其数据的私密性。因此,本地模型不会与远程模型共享任何隐私信息。此外,即使本地模型不逐字共享隐私信息,也能防止远程模型的操作员利用辅助信息重建隐私数据。为了应对这些挑战,我们假设不存在效率限制,本地模型可以随时向远程模型寻求帮助。因此,这种方法的最佳级联设置在于最大限度地降低隐私损失,同时最大限度地提高任务性能。

为了成功完成这项任务,通常规模较小、能力较弱的本地模型需要在以下两个方面找到平衡点:既要暴露足够多的问题信息,以便从能力更强的远程模型那里接收有用的信号,又要保护隐私细节。为了向远程模型学习,本地模型利用大规模语言模型的上下文学习(ICL)能力,通过自然语言实现无梯度学习功能。它还利用了 Mohtashami 等人(2023 年)和 Bandura & Walters(1977 年)最近提出的社会学习范式,即通过自然语言向其他大规模语言模型学习。

解决问题

本文探讨了一种没有标签数据的社会学习形式。本地模型 "学生 "拥有私人数据,自身无法很好地标注数据,而更大的远程模型 "教师 "则能更好地标注数据。这两个模型形成一个级联,如下图所示,"学生 "通过与"教师 "的交流提高性能。学生"发送给 "教师 "的信息称为 “查询”。

从 "学生 "到 "教师 "的查询有两个限制:第一个限制涉及隐私保护。第二个限制是单轮通信。学生 "和 "老师 "之间的交流只进行一轮,双方都无法保持对对方能力的了解,也无法更新自己的模型。因此,所有算法都遵循相同的结构。也就是说,如果 "学生 "需要帮助,"学生 "会使用私人数据向 "老师 "提出询问。然后,"教师 "使用该查询为 "学生 "生成一个 ICL(上下文学习)示例。最后,"学生 "使用 ICL 示例解决原始问题。

还有两个简化假设:第一个假设是,与远程 "教师 "的交流总是有益的;第二个假设是,"学生 "和 "教师 "都知道示例的格式。这一假设是有用的,因为"学生 "不仅仅是在学习格式和思维链(CoT),而是在向"教师 "学习有关数据的更复杂的东西。

在这种问题设置中,"学生 "的目标是在不泄露属于自己数据的私人信息的情况下,最大限度地提高准确标注数据的性能。

隐私保护措施

学生 "数据可能包含敏感的个人信息,这些信息应向 "教师 "保密。例如,在描述用户在某项活动后出现的健康症状的查询中,将某项活动或一组症状与特定用户联系起来就会侵犯隐私。

为了解决这些隐私泄露问题,可以考虑采用数据匿名化技术,如差分隐私(DP),但 DP 适用于计算许多用户的汇总数据;使用 DP 时,查询中的隐私和非隐私信息都会被掩盖,从而生成对任务无用的查询。这可能会产生对任务无用的查询。使用 DP-ICL 模型也更难将 "学生 "数据的敏感部分保密。

这是因为我们假设 "学生 "在生成查询时会考虑许多私人示例。在本文中,我们希望即使 "学生 "只有少量私人示例,也能生成保护隐私的查询。然而,DP-ICL 在这种情况下不起作用。

因此,它利用了数据最小化隐私技术,特别是上下文完整性。这将隐私描述为信息的正常流动。在这种技术中,"学生 "会保留对任务有用的信息,并删除与查询上下文无关的个人身份信息。即使有完美的掩码,如果 "教师 "模型获得了可用于识别某些特征的补充信息,敏感信息也会泄露。因此,所提方法的一个重要贡献就是提供了一种测量和评估辅助信息泄漏的方法。

拟议方法的成功取决于能否在不篡改任务描述的情况下正确识别和屏蔽查询的敏感部分。为此,我们提出了不同的技术来分析查询中的信息,并生成可与 "教师 "模型共享的安全查询。为了评估查询的私密性,我们考虑了两个特定的指标:实体泄漏指标和映射泄漏指标,后者考虑了考虑到辅助信息的配置。

上下文完整性将隐私定义为适当的信息流。在大多数生产应用中,很难确定哪些信息适合共享。作为替代,可以考虑对受损实体进行可解释的度量。数据集中的所有实体,如姓名、地点、电子邮件地址或号码,都被视为隐私。屏蔽后,我们会测量 "学生 "查询中还保留了多少原始示例中的实体。

即使从 "学生 "的查询中删除了所有实体,"教师 "仍有可能通过仔细分析查询来重建私人信息。事实上,"教师 "可以访问的辅助信息有助于提高其效率。这种分析是在最坏的情况下进行的。

具体来说,"教师 "会看到原始示例和 100 个屏蔽查询,假设其中只有一个是由原始示例生成的。测量"教师"在 100 个选项中能正确将原始示例映射到该特定(屏蔽)查询的频率。为 "教师 "提供一个完整的原始示例代表了"教师"可能拥有的辅助信息的上限。为了更好地进行映射,可以让 "教师 "查询 "学生 "模型。这一点很有用,因为它是用来生成屏蔽查询的。要进行映射,可对原始示例和 100 个生成查询的连续性进行评分,并衡量正确查询获得最高分的频率。对辅助信息的这种(最坏情况)访问表明,即使对实体进行了适当的屏蔽,仍可能导致严重的隐私泄露。

建议方法

它介绍了三种帮助 "学生 "私下向 "老师 "学习的算法。这些方法基于对 "学生 "所面临问题的描述,以及生成可由 "教师 "标记的类似非私人示例。所有方法都使用一个名为 "扩展大小 "的超参数来表示 "学生 "从 "教师 "那里获得的贴有标签的 ICL 示例的数量。

第一种方法(方法 1)是创建问题解释。这是一种 "学生 "首先分析给定问题,然后将其转化为高层次解释的方法。即使问题无法解决,"学生 "也能解释问题的类型。这一解释将成为 "教师 "的疑问。然后,"教师"会创建少量示例,帮助"学生"解决所面临的问题。教师"根据"学生"的描述,使用范例结构模板并生成新的范例。

第二种方法(方法 2)生成新的无标签示例。这种方法不是对"学生"面临的问题进行抽象描述,而是生成类似的新问题。例如,GSM8k 中学数学问题数据集可以生成细节不同但具有同等教育价值的类似数学问题。

研究表明,大规模语言模型可以从上下文中看到的原始示例生成新的示例。对于许多任务来说,生成示例比解决任务更容易。这种方法包括:(1)让"学生 "的大规模语言模型生成新的无标签示例;(2) "教师 "为这些示例贴标签;(3) "学生 "使用这些标签解决原始问题。

第三种方法(方法 3)是替换原始示例的实体。学生"不会生成一个全新的示例,而是替换原始示例中的实体,如姓名、地点、数字等。这样,它就生成了一个与原始示例相似的无标签新示例。这种方法还可以生成更大的示例。

大型语言模型在替换实体方面做得相当出色。因此,它指示 "学生 "模型查找并替换私有实体。除了在步骤 (1) 中替换实体外,该方法的整体流程与第二种方法相同。

在查询 "教师 "时,存在泄露私人信息的风险。因此,为了经济地使用 “教师”,我们引入了一个名为 "分组大小 "的超参数。这表示 "学生 "将对多少个私人示例进行分组,以创建扩展大小的 ICL 示例。学生 "结合分组示例的信息,合成新的示例。表示 "教师 "为每个原始示例创建标记示例的预算,即标记预算 = 扩展尺度/分组尺度。学生 "无法选择要分组的示例。

试验

为了评估所提方法的有效性,我们使用不同的数据集对其准确性和隐私性进行了评估,并与两种基线方法进行了比较。

本文使用谷歌提供的双子座 1.0 应变模型。我们使用功能最强大的 Ultra作为 “老师”,Nano-2(3.5B 参数模型,可在移动设备上部署)作为 “学生”。在某些实验中,Pro 被用作 “学生”,因为 "学生 "模型的能力会影响方法的性能。在所有实验中,任务成功率均以 "教师 "的性能为标准,这是基于之前有关 Nano 性能的报告(Google,2023 年)。

为了证明拟议方法的多功能性,我们使用了以下不同的数据集

  • GSM8k 数学问题(Cobbe 等人,2021 年)。
  • 助理意图检测(Srivastava 等人,2022 年)。
  • 主观/客观分类(Conneau & Kiela,2018)。
  • 利用中等资源进行机器翻译(Tiedemann,2020 年)。

与基线的比较还包括两种基线:弱基线和强基线。在弱基线中,"学生 "完全不与 "教师 "交流,自己也没有标签数据,因此是零镜头设置。在强基线中,我们评估的是 "学生 "可以访问 8 个任意完美标记示例的情况。这些示例被认为是强基线,因为它们被完美标注,而且与 "学生 "试图解决的任务完全相同。但实际上,这样的数据并不存在,而且也不容易适应 "学生 "的问题。

结果如下表所示。在所有数据集中,建议的方法都优于弱基线和强基线。然而,对于 GSM8k,我们发现需要一个强大的 "学生 "模型,如 Pro。

(方法 3)在所有数据集上的表现都非常好。这可能是因为这种方法生成的查询最接近"学生 "试图解决的问题。(方法 1)的表现最差,我们发现这种方法最难发挥作用。例如,对于意图识别等任务,这种方法的竞争力较弱,因为只有在学生模型可以被标记的情况下,这种方法才能明确考虑未标记的示例。

此外,还使用不同的方法进行了全网格搜索,以研究标签预算(扩展大小/组大小)的最佳使用方法。对于每种贴标预算,都能获得最佳性能。如下图所示,选择这些超参数可以使预算小于 1,而如果不分组,预算是不可能小于 1 的。

此外,为了分析所建议的方法在隐私方面的表现,我们计算了两个指标:实体泄漏指标和映射泄漏指标,后者考虑了辅助信息的配置,Gemini 1.0 Ultra 被用作实体检测器和名称、私人实体,如位置、号码等。为了确保它能可靠地检测到所需的实体,我们对一部分示例进行了人工验证。分析结果如下表所示。

据观察,(方法 1)泄露的实体最多。虽然这种方法理论上应产生最高级别的查询,但在实践中却很难奏效。在原始示例的子集中,"学生 "可能无法合成高层次的解释,转而详细解释所面临的问题。另一方面,(方法 3)中的查询最接近原始信息,但泄露的实体最少。这可能是因为 "学生 "可以在没有充分理解问题的情况下找到并替换实体。

然而,在分析映射指标(表示攻击者利用辅助信息识别原始示例的能力)时,结果却有所不同。在这一指标上,(方法 3)明显逊色。虽然这种方法泄露的实体较少,但它保留了结构和风格,因此特别容易在原始示例和生成示例之间进行映射。在结构清晰的 GSM8k 和 Subj 数据集上尤其如此。

研究发现,分组示例与(方法 2)配合使用效果特别好。在分组大小 = 2 的情况下,两个指标的泄漏率都显著降低,这在 GSM8k 中可以实现而不会降低性能。

最后,应该指出的是,选择适当的方法取决于具体的威胁模型。虽然(方法 1)在质量和私密性方面并不令人信服,但(方法 3)在不包含辅助信息的威胁模型中却非常有效。另一方面,当考虑到辅助信息时,(方法 2)最为合适。

为了更好地理解所提出的方法在哪些方面行之有效,在哪些方面存在不足,我们还对 "学生 "模型在接受 "教师 "帮助后所能做出的预测进行了详细分析。为了进行大规模分析,我们要求Gemini 1.0 Ultra 查看黄金标签和"学生"预测,并将错误划分为特定类别。对一些案例的人工检查证实了这些分类是有效的。下表显示了基于强基线和每种方法的最佳设置对 500 个 GSM8k 案例的分析结果。

总结

本文研究了大规模语言模型能否向外部大规模语言模型发送保护隐私的查询并提高其性能。结果表明,所提出的方法明显优于有隐私限制的强基线方法。

我们使用了两个指标来评估所提出方法的隐私性能:一个是计算受损实体数量的简单指标,另一个是衡量拥有辅助信息的 "教师 "能从 "学生 "的查询中恢复多少信息的新指标。第一个指标发现,掩盖问题的方法是有效的,而当 "教师 "拥有辅助信息时,生成新问题的方法是有效的。

最终,选择哪种方法取决于具体的威胁模型。然而,对于这两种威胁模型,所提出的方法都显示出较低的泄漏率,并且优于强质量基线。此外,对样本进行分组还能提高隐私度量,这证明即使在特定的标签预算限制下,模型的质量也能得到提高。

预计未来的研究将考虑更复杂的 "学生 "和 "教师 "互动,进一步改进隐私指标,并关注文本以外的其他模式。

注:
论文地址:https://arxiv.org/abs/2404.01041

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/15032.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

CloudDM Team Docker 版安装指南

CloudDM Team 是一款全新的国产自研数据库管理工具,在《全新的企业级数据库数据安全管控平台》 一文中全面介绍了其核心功能和特点。本文将会介绍如何在 Ubuntu Linux 中安装并初步使用这款数据库管理工具。 准备工作 安装 Docker CloudDM Team 安装过程中需要用…

第22天Linux下常用工具

目录 第 1 章 vim 编辑器 1.1 vim 安装 1.2 vim 的使用 1.3 vim 的 4 种工作模式 第 2 章 gcc 编译器 2.1 编译流程(以 main.c 为例) 2.2 gcc 的常用参数 2.3 进行多模块编译 第 3 章 动态库静态库的制作 3.1 库的作用 3.2 库的分类与特点 …

/// ts中的三斜线指令 | 前端

第一次看到注意到这行代码,不知道的还以为是注释呢,查了资料才知道这是typescript中的三斜线指令,那有什么作用呢? 1. 这行代码是TypeScript中的一个三斜线指令(Triple-Slash Directive),用于…

Schnorr 和 BLS 算法详解

Schnorr 签名和 BLS 签名在区块链技术中都有着重要的应用。它们各自具备独特的优势,使其在不同的区块链应用场景中得到广泛使用。 Schnorr签名算法 Schnorr签名算法是一种基于离散对数问题的数字签名算法, 由德国密码学家 克劳斯施诺尔 (Cl…

C++类和对象 - 拷贝构造, 赋值重载

拷贝构造函数 拷贝构造作用:一个已经存在的对象去初始化另一个要创建的对象 日常写代码中会出现如下场景: class Data { public:Data(int year, int month, int day) // 拷贝构造函数{this->_year year;this->_month month;this->_day day;} priva…

为什么咨询公司需要项目管理软件:7大关键优势

在咨询公司中,同时管理多个项目、客户和目标并非易事,尤其需要兼顾长期发展。项目管理软件就成为了各类项目型企业(包括咨询公司)的重要工具。 对于顾问来说,项目管理软件可以简化工作流程、增强客户关系并提高效率。本…

3大核心技术,免费开源的智能合同审查分析软件的技术介绍

本智能合同审查分析系统致力于解决法律领域中复杂文档与信息处理的难题,采用最先进的深度学习与自然语言处理(NLP)技术,提供精准的实体识别与关系抽取功能。系统基于BERT、GPT等主流模型,实现自动识别和关联法律文档中…

GitCode光引计划有奖征文大赛

一、活动介绍 GitCode平台汇聚了众多杰出的G-Star项目,它们犹如璀璨星辰,用各自的故事和成就,为后来者照亮前行的道路。我们诚邀广大开发者、项目维护者及爱好者,共同撰写并分享项目在GitCode平台上托管的体验,挖掘平…

UE4 Cook 从UAT传递参数给UE4Editor

需求 一句Cook的命令如下: ${EnginePath}/Engine/Build/BatchFiles/RunUAT.sh BuildCookRun -project${ClientPath}/${ProjectName}.uproject -noP4 -platformIOS -cooksinglepackage -client -clientconfig${CookConfig} -iterate -skipbuild -nocompile -NoMutex…

api驱动的云服务是什么意思?

API驱动的云服务是指利用API技术来驱动和提供云服务的模式。在这种模式下,云服务提供商会公开一系列的API接口,允许开发者或应用程序通过调用这些API来实现对云服务的访问和操作。API驱动的云服务是现代云计算技术的重要组成部分,API驱动的云…

Springboot 启动端口占用如何解决

Springboot 启动端口占用如何解决 1、报错信息如下 *************************** APPLICATION FAILED TO START ***************************Description:Web server failed to start. Port 9010 was already in use.Action:Identify and stop the process thats listening o…

【Rust调用Windows API】杀掉指定进程(包括兄弟进程、子进程、父进程)

前言 前面一篇文章写了使用Rust调用Windows API 获取正在运行的全部进程信息 ,本篇实现杀掉指定进程。 通过标准库可以管理当前进程创建的子进程,要 kill 掉子进程也比较容易,这里不赘述了,主要实现通过调用Windows API来杀掉兄…

基于Python的外卖点餐系统

作者:计算机学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等,“文末源码”。 专栏推荐:前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码、微信小程序源码 精品专栏:…

世界坐标系、相机坐标系、图像物理坐标系、像素平面坐标系

坐标系及其转换在计算机视觉领域占据核心地位。理解如何从一个坐标系转换到另一个坐标系,不仅是理论上的需要,也是实际应用中不可或缺的技能。 一、世界坐标系的定义 世界坐标系是一个全局的坐标系统,用于定义场景中物体的位置。在这个坐标…

Pycharm也可以用来查看和操作MySQL数据库?

1.首先确保自己的电脑安装好MySQL MySQL :: Download MySQL Community Server 2.在创建project界面选择Open 打开并选择自己存放sql文件的路径 完成后的效果 3.创建好数据库的连接 4.打开Database视窗 5.给数据库添加新的Schema 6.运行需要查看或者操作的sql文件 7.选择适合的…

1、VMware12安装ubuntu18.04

1、ubuntu18地址获取: Index of /ubuntu-releases/18.04/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror 2、安装过程: 1、新建虚拟机 2、选择稍后安装操作系统 3.客户机操作系统选择Linux,版本选择Ubuntu 64位 4、点击“自定义…

数据结构查找-哈希表(创建+查找+删除)+(C语言代码)

#include<stdlib.h> #include<stdio.h> #include<stdbool.h> #define NULLKEY -1//单元为空 #define DELKEY -2//单元内容被删除 #define M 20 typedef struct {int key;//关键字int count;//统计哈希冲突探测次数 }HashTable; //插入到哈希表 void InsertHT…

基于Java的周次生成工具类实现

摘要&#xff1a; 本文介绍了一个基于Java的周次生成工具&#xff0c;用于根据指定的年份和周次类型&#xff08;自然周或财务周&#xff09;生成连续的周次列表数据。 需求描述&#xff1a; 根据周次类型&#xff0c;生成连续的周次列表数据。 周次类型分2种&#xff1a; …

为什么华大严选基因是您的最佳选择?品牌特色全解析

《为什么华大严选基因是您的最佳选择&#xff1f;品牌特色全解析》 在当今基因检测市场竞争激烈的环境下&#xff0c;华大严选基因以其卓越的品质和独特的品牌特色脱颖而出&#xff0c;成为众多消费者的首选。作为 DNA 基因检测行业十佳优质品牌和 3・15 重点推荐品牌&#xff…

中仕公考怎么样?国考有三不限岗位吗?

国考有三不限岗位吗? “三不限”岗位&#xff0c;即不限制专业、学历和户籍的岗位。国考中几乎没有“三不限”岗位。因为公务员国考的报考条件通常较为严格&#xff0c;尤其是不限制条件的职位更少见&#xff0c;所以国考中一般是没有三不限岗位的。 与省考公务员不同的是&a…