身份安全风险不断上升:企业为何必须立即采取行动

在推动安全AI 模型的过程中,许多组织已转向差异隐私。但这种旨在保护用户数据的工具是否阻碍了创新?

开发人员面临一个艰难的选择:平衡数据隐私或优先考虑精确结果。差分隐私可以保护数据,但通常以牺牲准确性为代价——对于医疗保健和金融等行业来说,这是一种不可接受的权衡,因为在这些行业中,即使是微小的错误也可能造成严重后果。

寻找平衡

差异隐私通过添加随机噪声来保护个人数据,使得在保留数据集的同时识别个人变得更加困难。

基本概念围绕一个参数 epsilon ( ε ) 展开,该参数充当隐私旋钮。较低的 epsilon 值可实现更强的隐私保护,但会增加更多噪音,从而降低数据的实用性。

一家大型金融科技公司的开发人员最近对差分隐私对其欺诈检测系统的影响表示不满,该系统需要检测交易数据中的微小异常。他们解释说:“当为了保护用户数据而添加噪音时,那些细微的信号就会消失,使我们的模型效率大大降低。”欺诈检测依赖于发现微小的偏差,而差分隐私很容易掩盖这些关键细节。

医疗保健领域的风险甚至更高。例如,用于乳腺癌检测的 AI 模型依赖于医学图像中的精细图案。添加噪音以保护隐私可能会模糊这些图案,从而可能导致误诊。这不仅仅是技术上的不便,还可能危及生命。

差异隐私局限性的一个典型例子是 2020 年美国人口普查。人口普查局首次使用差异隐私来匿名化个人数据。虽然目标是加强隐私保护,但结果却出现了意想不到的后果:注入较小社区数据的噪音扭曲了人口统计信息,导致学校收到错误的资金以及公共服务与实际社区需求不匹配等问题。

各行各业的开发人员都熟悉这种困境。无论是在政府、医疗保健还是金融领域,他们通常都必须遵守隐私法,同时保持数据准确性。当平衡过于偏向隐私时,它会产生远远超出软件性能的连锁反应。

重新思考数据收集

隐私辩论中的一个关键问题是:我们真的需要收集这么多数据吗?隐私问题往往源于过度收集,而不仅仅是我们如何处理数据。“数据越多,模型越好”这一信念促使组织储存信息,尽管其中很多信息都没有用到。

例如,我曾经为一家初创公司提供咨询,这家公司积累了数 TB 的用户数据,但目的不明确。当被问及原因时,他们回答说:“我们可能有一天会需要它。”这增加了隐私风险,并给开发人员带来了庞大的数据集负担,从而降低了性能。数据集越大,匿名化所需的噪声就越多,这进一步降低了模型的准确性。

更智能的数据收集策略有助于解决隐私问题和模型准确性这两个问题。通过只关注必要数据,公司可以减少需要匿名化的信息量,为开发人员提供更干净、更准确的数据集。

开发商的隐性成本

时间是开发人员最宝贵的资源之一,而差分隐私往往会导致效率低下。花费在抵消噪音所损失的准确度上的时间本可以更好地用于构建新功能或改进模型。一家电子商务公司在向其推荐引擎添加差分隐私时,从惨痛经历中吸取了教训。旨在保护用户数据的噪音导致了不相关的产品建议,例如向购买衣服的顾客推荐厨房用具。

这让用户感到沮丧,并推迟了新功能的发布,使公司在速度至关重要的行业中处于竞争劣势。

挑战与限制

差异隐私面临的最大挑战之一是在隐私和数据效用之间找到适当的平衡。隐私应用得越多,数据就越没用。这对于依赖大型数据集中精确模式的人工智能模型来说尤其成问题,因为即使是很小的误差也会破坏关键结果。开发人员,尤其是那些需要高精度的领域的开发人员,一直对差异隐私迫使他们在安全性和性能之间做出妥协表示担忧。

探索更智能的隐私解决方案

如果差分隐私不是每种情况的最佳解决方案,那么还有哪些替代方案?两个有希望的选择是联合学习和更智能的数据收集。

联合学习在智能手机等分散设备上训练 AI 模型,无需共享原始数据。相反,只会发回聚合的匿名更新,在保持模型准确性的同时保护隐私。谷歌和苹果等公司将这种技术用于预测文本等服务,在不暴露敏感数据的情况下改进模型。

联邦学习 (FL) 允许数据保留在生成数据的设备上,从而增强数据隐私。这种方法减少了传输过程中敏感信息的暴露。此外,通过最大限度地减少集中存储,FL 降低了大规模数据泄露的风险。

FL 还通过将训练过程分散到多个客户端来降低集中攻击风险。即使一台设备受到攻击,攻击者也只能访问一小部分数据。

更智能的数据收集侧重于仅收集最相关的信息。我曾合作过的一家医疗保健公司从收集大量患者数据转变为仅关注改进诊断模型所需的关键数据点。通过使用较小的有针对性的数据集,他们无需依赖差异隐私即可保持较高的准确率。

灵活的法规以实现更智能的隐私

GDPR和 CCPA等隐私法规促使许多公司默认采用差异隐私。但隐私挑战并不统一。随着人工智能的发展,隐私法也需要适应。

与我交谈过的一位 AI 伦理顾问总结道:“政府必须认识到 AI 正在不断发展。差异隐私解决了一些老问题,但 AI 已经取得了快速发展。”为了让开发人员采用适合其模型的隐私方法,法规需要提供更大的灵活性,允许采用在不牺牲性能的情况下保护隐私的方法。

重新思考人工智能开发中的隐私

随着人工智能不断改变行业,组织显然需要重新考虑其隐私保护方法。差异隐私有其适用之处,但它远非人们通常所认为的万能解决方案。

通过采用联合学习和更智能的数据收集等替代方案,开发人员可以在不牺牲创新的情况下构建准确、保护隐私的 AI 模型。组织不应收集大量数据,而应专注于只收集必要的数据。真正的问题可能不是如何保护我们收集的数据,而是我们是否应该首先收集这么多数据。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/148191.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

某省公共资源交易中心爬虫逆向分析

目标网站 aHR0cHM6Ly95Z3AuZ2R6d2Z3Lmdvdi5jbi8jLzQ0L3NjenQteHEvP3VzZXJJZD02NzM4OTg2MzkyNjA3NzAzMDQmcm93SWQ9NTI1MDYyMDI2ODg0NzE2NTQ0JnRpbWU9MjAwOC0xMS0yNiZjZXJ0aWZpY2F0ZU5vPTkxNDQwOTA0NjgyNDI2MzU4QyZjZXJ0aWZpY2F0ZVR5cGU9Mjg 一、抓包分析 请求头参数加密 二、…

【学习笔记】手写 Tomcat 五

目录 一、优化 Servlet 创建一个抽象类 继承抽象类 二、三层架构 业务逻辑层 数据访问层 1. 在 Dao 层操作数据库 2. 调用 Dao 层,实现业务逻辑功能 3. 调用 Service 层,响应数据 测试 三、数据库连接池 1. 手写数据库连接池 2. 创建数据库…

2024年9月19日---关于ES6(2)

五 异步编程 5.1 回调函数 5.1.1 概念 回调函数(callback function),当一个函数作为参数传入另一个参数中,并且它不会立即执行,只有当满足一定条件后该函数才可以执行,这种函数就称为回调函数。 你可以将其理解为 回头再调用的…

GNU编译器(GCC):编译的4个过程及.elf、.list、.map文件功能说明

0 参考资料 GNU-LD-v2.30-中文手册.pdf GNU linker.pdf1 前言 一个完整的编译工具链应该包含以下4个部分: (1)编译器 (2)汇编器 (3)链接器 (4)lib库 在GNU工具链中&…

开源 AI 智能名片 S2B2C 商城小程序与营销工具的快速迭代

摘要:本文以开源 AI 智能名片 S2B2C 商城小程序为研究对象,探讨在营销工具快速迭代的背景下,该小程序如何借鉴以拼多多为代表的“小程序拼团”、以蘑菇街为代表的“小程序直播”、以花点时间为代表的“小程序按月订花”等经典案例&#xff0c…

数据集-目标检测系列-摩托车检测数据集 motorcycle >> DataBall

数据集-目标检测系列-摩托车检测数据集 motorcycle >> DataBall 数据集-目标检测系列-摩托车(motorcycle)检测数据集 数据量:1W 想要进一步了解,请联系 DataBall。 DataBall 助力快速掌握数据集的信息和使用方式&#xf…

《论软件架构建模技术与应用》写作框架,软考高级系统架构设计师

论文真题 软件架构风格是描述一类特定应用领域中系统组织方式的惯用模式,反映了领域中诸多系统所共有的结构特征和语义特征,并指导如何将各个模块和子系统有效组织成一个完整的系统。分层架构是一种常见的软件架构风格,能够有效简化设计&…

Python语法进阶之路

一、Python基础 1.1 注释 定义和作用 对代码解释说明,增强可读性 单行注释 # 多行注释 """ 这是一个多行注释 """ 1.2 变量及变量类型 定义和作用 计算机目的是计算,编程是为了更方便计算,计算对象就是…

论前端框架的对比和选择 依据 前端框架的误区

前端框架的对比和选择依据 在前端开发中,有多种框架可供选择,以下是一些常见前端框架的对比和选择依据: 一、Vue.js 特点: 渐进式框架,灵活度高,可以逐步引入到项目中。学习曲线相对较平缓,容…

Attention is All You Need精读

原文开头,不是搬运 dog。All attention is all you need Abstract 摘要 这篇文章的内容源于基于编码器-解码器架构的RNN模型,在其他人的工作中,我们可以发现注意力机制对于提升编码器-解码器架构模型的性能很重要。这篇文章提出了一个比较简…

SpringBoot 更改启动图标

每次springboot开启时,开会显示spring的图标,这个图标是可以修改的。 一、原始的图标样式 二、修改图标样式 https://patorjk.com/software/taag/#pdisplay&fGraffiti&thttps://patorjk.com/software/taag/#pdisplay&fGraffiti&t 在…

MMROTATE 1.X特征图可视化(绘制Heat Map)

本文参考MMYOLO官方的特征图可视化教程,对MMROTATE相关算法进行特征图可视化 1. 新建featmap_vis_demo.py文件 在mmrotate项目文件夹下新建 featmap_vis_demo.py : # Copyright (c) OpenMMLab. All rights reserved. import argparse import os from t…

“吉林一号”宽幅02B系列卫星

离轴四反光学成像系统 1.光学系统参数: 焦距:77.5mm; F/#:7.4; 视场:≥56゜; 光谱范围:400nm~1000nm。 2.说明: 光学系统采用离轴全反射式结构,整…

CIM平台应用的一些思考

今天中午看了一些书,讲致幻剂在疾病治疗的一些作用。致幻剂包括毒蘑菇等这类东西,有精神疾病或其他心里疾病的患者在吸食或注射(专业医生的指导下)会忘记或减轻身体的痛苦,忘记死亡,相信永生,治…

VMWare虚拟机安装CentOS-7-x86_64-DVD-1611操作系统

VMWare虚拟机安装CentOS7操作系统 1、虚拟机准备打开VMware单机创建新的虚拟机典型与自定义安装选择虚拟机硬件兼容性选择安装程序光盘映射文件(iso)选择客户机操作系统命名虚拟机处理器配置内存配置网络连接类型I/O类型选择磁盘类型选择磁盘指定磁盘的最大磁盘大小磁盘名称我们…

高中数学:立体几何-平面的定义与公理

文章目录 一、平面定义及画法1、定义2、表示方法 二、公理1、公理12、公理23、公理3 一、平面定义及画法 1、定义 平面是向四周无限延展的。 2、表示方法 我们常用矩形的直观图,即平行四边形表示平面. 我们常用希腊字母α,β&#xff0c…

八. 实战:CUDA-BEVFusion部署分析-coordTrans Precomputation

目录 前言0. 简述1. 案例运行2. coordTrans3. Precomputation总结下载链接参考 前言 自动驾驶之心推出的 《CUDA与TensorRT部署实战课程》,链接。记录下个人学习笔记,仅供自己参考 本次课程我们来学习下课程第八章—实战:CUDA-BEVFusion部署分…

『正版软件』XYplorer 专业的 Windows 文件管理工具软件

在数字化时代,我们每天都在与各种文件打交道。无论是工作文档、个人照片还是多媒体资料,管理这些文件的效率直接关系到我们的工作效率和生活体验。今天,我要向大家推荐一款功能强大、操作简便的文件管理软件 —— XYplorer。 XYplorer&#x…

【小bug】使用 RestTemplate 工具从 JSON 数据反序列化为 Java 对象时报类型转换异常

起因:今天编写一个请求时需要通过RestTemplate调用外部接口,获取一些信息,但是在获取了外部接口响应内容后,使用强制转换发现报了类型转换异常。之前也遇到过,但是没记录下来,今天又查了一遍……干脆记录一…

【hot100-java】【搜索旋转排序数组】

R8-二分查找篇 等等,不是?O(logn)?那岂不是一次遍历数组都超时了hh. 二分查找分类 class Solution {public int search(int[] nums, int target) {if (numsnull||nums.length0){return -1;}int start0;int endnums.length-1;int mid;while …