FairJob:促进在线广告系统公平性研究

       在人工智能(AI)与人类动态的交汇处,既存在机遇也存在挑战,特别是在人工智能领域。尽管取得了进步,但根植于历史不平等中的持续偏见仍然渗透在我们的数据驱动系统中,这些偏见不仅延续了不公平现象,还加剧了社会的分歧。历史上的偏见影响了数据收集,对AI模型的结果产生了影响,经常放大了现有的不平等状况。尽管存在关于隐私、责任和公共关系的担忧,但收集特殊和敏感类别数据对于偏见评估至关重要。此外,不断演变的法律框架,例如最近的AI法案和通用数据保护条例[英国信息专员办公室,2022年],要求检测、预防和减轻偏见,同时对敏感数据的使用施加了一些限制。

      在广告中的算法歧视可能与敏感垂直领域有关,这些领域突出了有益的就业、金融和住房机会,或者关于谁看到了可能不太受欢迎的广告,例如掠夺性贷款服务的广告。虽然广告中的不公平行为不是惩罚性的,而是辅助性的,即公平性在于提供平等获取宝贵机会的机会,但确保广告实践的公平性至关重要。

      大多数关于广告中歧视行为的研究都是通过创建广告活动、选择目标受众,并从用户的角度分析数据进行的,而没有访问算法特征。缺乏公开可用的、现实的数据集导致研究人员基于私有数据发布结果,导致科学界的主张无法复现。这为关键评估和在科学界建立在先前工作之上带来了挑战。

在线广告筛选简化流程

为了促进现实场景中的公平性研究,本文发布了一个大规模的公平意识广告FairJob数据集

链接:https://huggingface.co/datasets/criteo/FairJob。

1 广告中的公平性问题

1.1 招聘广告中的性别歧视

     研究表明,招聘广告的投放过程中存在性别歧视现象。例如,管理职位的招聘广告更倾向于展示给男性用户,这可能导致女性用户获得的机会更少,加剧性别差距。

      这种歧视可能并非广告服务平台的本意,而是由于数据偏差或算法设计不当导致的。

1.2 市场偏差

       广告投放平台通常采用实时竞价 (RTB) 机制进行广告投放。在这个过程中,平台会根据用户和广告主的特征进行竞价,并选择最优的广告进行展示。

      由于市场竞争和成本效益的考虑,一些广告主可能会针对特定群体投放广告。例如女性用户可能更贵,因此平台可能会减少对女性用户的广告投放。这种市场偏差可能会导致广告投放结果出现不公平现象。

1.3 算法偏差

广告推荐算法可能会根据用户的历史行为和特征进行推荐,如果这些数据和算法存在偏差,那么推荐结果也可能存在偏差。

例如,如果算法认为男性用户更倾向于点击某些类型的广告,那么这些广告就会更频繁地展示给男性用户,从而导致女性用户获得的机会更少。

1.4 评估指标

       广告推荐系统的评估指标通常包括点击率、转化率等,但这些指标可能无法完全反映广告的公平性。

     例如,即使广告投放结果在不同群体之间没有显著差异,但如果某些群体对广告的响应率本身就较低,那么这种结果仍然是不公平的。

1.5 数据隐私

为了评估和解决广告中的公平性问题,需要收集和分析用户的数据,包括敏感数据(例如性别、种族等)。

然而,收集敏感数据可能涉及到数据隐私和安全问题,需要进行严格的保护和管理。

2 FairJob数据集

       FairJobs 数据集是一个用于研究广告推荐系统公平性的大型数据集。它包含匿名化的用户和广告主特征,以及广告投放结果,旨在帮助研究人员评估和解决广告中的公平性问题。

2.1 数据来源

     FairJobs 数据集来自 Criteo AdTech 公司在 2024 年进行的一项为期 5 个月的招聘广告投放活动。数据包含以下信息:

  • 用户特征: 包括 20 个匿名化的类别特征和 39 个匿名化的数值特征。
  • 广告主特征: 包括 7 个匿名化的类别特征。
  • 广告投放结果: 包括点击情况(是否点击广告)、广告是否为高级职位、以及用户、广告和广告投放的唯一标识符。
  • 敏感属性代理: 由于数据集不包含性别等敏感信息,因此使用用户与男性或女性产品互动的倾向作为性别代理。

2.2 数据特点

  • 大规模: 数据集包含 107 万多条记录,可以用于训练和评估大规模的机器学习模型。
  • 多样性: 数据集包含多种类型的特征,包括类别特征和数值特征,可以用于研究不同类型特征的公平性问题。
  • 不平衡性: 数据集的正负样本比例严重不平衡,可以用于研究不平衡数据下的公平性问题。
  • 匿名化: 数据集经过匿名化处理,保护用户隐私。

2.3 数据应用

     FairJobs 数据集可以用于以下研究:

  • 公平性评估: 评估广告推荐系统的公平性,例如不同性别群体获得广告的机会是否平等。
  • 公平性算法设计: 开发新的公平性算法,例如“公平性惩罚”和“对抗训练”,以减少算法偏差。
  • 评估指标改进: 开发新的评估指标,例如“群体公平性”和“机会公平性”,以更全面地评估广告推荐系统的公平性。
  • 数据隐私保护: 研究数据匿名化、差分隐私等技术,保护用户数据隐私。

2.4 FairJobs 数据集的优势

  • 真实场景: 数据集来自真实的广告投放活动,可以更好地反映现实世界中的公平性问题。
  • 匿名化: 数据集经过匿名化处理,可以保护用户隐私。
  • 开放获取: 数据集开放获取,方便研究人员进行研究和实验。

2.5 FairJobs 数据集的局限性

  • 敏感属性代理: 由于数据集不包含性别等敏感信息,因此使用用户与男性或女性产品互动的倾向作为性别代理,可能存在一定的误差。
  • 数据不平衡性: 数据集的正负样本比例严重不平衡,可能会影响模型的训练和评估。
  • 市场偏差: 数据集可能存在市场偏差,例如某些广告主可能更倾向于投放给特定群体。

3 实验

3.1 实验设置

实验源代码:https://github.com/criteo-research/FairJob-dataset

3.1.1 数据集

FairJob 数据集,包含 1,072,226 条记录,每条记录包含用户特征、产品特征、点击标签、性别代理、职位等级等信息。

3.1.2 模型

3.1.2.1 基线模型

  • Dummy: 基于单一阈值对正类概率进行分类。在无感知设置中使用,即不考虑受保护属性。Dummy分类器的性能虽然有限,但它提供了一个基准,帮助我们理解在没有任何模型学习的情况下的公平性水平。
  • XGBoost:一个强大的梯度提升框架,用于处理各种类型的数据。在实验中,分别在不公平(包含受保护属性)和无感知(不包含受保护属性)设置下使用。
  • XGBoostLogistic Regression:逻辑回归是一种广泛应用于二元分类问题的统计方法。在实验中,使用逻辑回归来评估不公平、无感知和公平设置下的性能。

3.1.2.2 公平性模型

  • 公平 XGBoost: 使用公平性惩罚的 XGBoost 模型。
  • 公平 Logistic Regression: 使用公平性惩罚的 Logistic Regression 模型。

3.1.3 训练设置

  • 特征嵌入: 使用嵌入方法将类别特征转换为数值特征。
  • 类别不平衡: 使用过采样方法来处理类别不平衡问题。
  • 超参数调整: 使用 Optuna 库进行贝叶斯优化,以找到最佳的超参数设置。
  • 评估: 使用测试集评估模型的公平性和性能。

3.2 评估指标

3.2.1 公平性指标

  • 人口统计学平等性 (Demographic Parity, DP): 该指标衡量模型对不同性别群体预测结果的差异。理想情况下,DP 应该为 0,表示模型对不同性别的用户展示高级职位广告的概率相同。
  • 平等化机会 (Equal Opportunity): 该指标确保模型对不同性别群体预测正类结果的能力相同。然而,FairJob 论文没有使用该指标,因为它可能导致更多对弱势群体的误分类。
  • 平等化公平 (Equalized Odds): 该指标确保模型对不同性别群体预测正类和负类结果的能力相同。FairJob 论文也没有使用该指标,因为它可能导致更多对弱势群体的误分类。

3.2.2 性能指标

  • 负对数似然 (Negative Log-Likelihood, NLLH): 该指标衡量模型预测结果的准确度。NLLH 越低,模型的预测能力越强。
  • ROC 曲线下面积 (Area Under the ROC Curve, AUC): 该指标衡量模型区分正类和负类结果的能力。AUC 越高,模型的预测能力越强。
  • 点击-排名效用 (Click-Rank Utility, U): 该指标衡量模型推荐广告的点击率。U 越高,模型推荐的广告越受用户欢迎。
  • 产品-排名效用 (Product-Rank Utility, ˜U): 该指标考虑了选择偏差,衡量模型推荐广告的点击率。˜U 越高,模型推荐的广告越受用户欢迎,并考虑了选择偏差的影响。

3.3 实验结果

  • 基线模型: Dummy 模型在 DP 方面表现最佳,但在 NLLH 和 AUC 方面表现较差。XGBoost 模型在 NLLH 和 AUC 方面表现较好,但在 DP 方面表现较差。
  • 公平性模型: 使用公平性惩罚的模型在 DP 方面表现有所提高,但 NLLH 方面有所下降。公平性惩罚的 Logistic Regression 模型在 DP 和 ˜U 方面表现有所提高,同时 NLLH 方面下降较少。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1474191.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

生成式AI的短板在于“Token”的存在

生成式AI模型处理文本的方式与人类不同。理解它们基于“token”的内部环境,可能有助于解释一些奇怪行为和固有局限性。 从小型设备上的Gemma到OpenAI领先行业的GPT-4o,大多数模型都是基于一种称为Transformer的架构。由于Transformer在将文本与其他类型…

git把本地分支的提交到自己的远程分支,然后合并特定远程分支

1、首先,把本地更改的代码放到暂存区:git add . 2、把暂存区的代码进行提交:可以直接在控制台提交也可以使用代码git commit -m "进行的操作的注释" 提交前: 提交后: 3、使用git pull拉取代码(这…

(南京观海微电子)——MOS管原理及应用区别

MOS管: 全称为金属氧化物半导体场效应管(Metal Oxide Semiconductor Field Effect Transistor),也被称为MOSFET(Metal-Oxide-Semiconductor Field-Effect Transistor)。它是一种半导体器件,常用…

图论·Day01

P3371 P4779 P3371 【模板】单源最短路径(弱化版) 注意的点: 边有重复,选择最小边!对于SPFA算法容易出现重大BUG,没有负权值的边时不要使用!!! 70分代码 朴素板dijsk…

【pytorch20】多分类问题

网络结构以及示例 该网络的输出不是一层或两层的,而是一个十层的代表有十分类 新建三个线性层,每个线性层都有w和b的tensor 首先输入维度是784,第一个维度是ch_out,第二个维度才是ch_in(由于后面要转置),没有经过softmax函数和…

Fast R-CNN(论文阅读)

论文名:Fast R-CNN 论文作者:Ross Girshick 期刊/会议名:ICCV 2015 发表时间:2015-9 ​论文地址:https://arxiv.org/pdf/1504.08083 源码:https://github.com/rbgirshick/fast-rcnn 摘要 这篇论文提出了一…

基于java+springboot+vue实现的校园外卖服务系统(文末源码+Lw)292

摘 要 传统信息的管理大部分依赖于管理人员的手工登记与管理,然而,随着近些年信息技术的迅猛发展,让许多比较老套的信息管理模式进行了更新迭代,外卖信息因为其管理内容繁杂,管理数量繁多导致手工进行处理不能满足广…

Stream流真的很好,但答应我别用toMap()

你可能会想,toList 和 toSet 都这么便捷顺手了,当又怎么能少得了 toMap() 呢。 答应我,一定打消你的这个想法,否则这将成为你噩梦的开端。 让我们先准备一个用户实体类。 Data AllArgsConstructor public class User { priv…

昇思MindSpore学习总结十——ResNet50迁移学习

1、迁移学习 (抄自CS231n Convolutional Neural Networks for Visual Recognition) 在实践中,很少有人从头开始训练整个卷积网络(使用随机初始化),因为拥有足够大小的数据集相对罕见。相反,通常…

LLM - 循环神经网络(RNN)

1. RNN的关键点:即在处理序列数据时会有顺序的记忆。比如,RNN在处理一个字符串时,在对字母表顺序有记忆的前提下,处理这个字符串会更容易。就像人一样,读取下面第一个字符串会更容易,因为人对字母出现的顺序…

Linux应用---信号

写在前面:在前面的学习过程中,我们学习了进程间通信的管道以及内存映射的方式。这次我们介绍另外一种应用较为广泛的进程间通信的方式——信号。信号的内容比较多,是学习的重点,大家一定要认真学,多多思考。 一、信号概…

【AI资讯】可以媲美GPT-SoVITS的低显存开源文本转语音模型Fish Speech

Fish Speech是一款由fishaudio开发的全新文本转语音工具,支持中英日三种语言,语音处理接近人类水平,使用Flash-Attn算法处理大规模数据,提供高效、准确、稳定的TTS体验。 Fish Audio

驾校管理系统设计

驾校管理系统设计旨在提高驾校运营效率、学员管理、教练安排、考试预约、财务结算等方面的能力。以下是一个基本的设计框架,包括关键模块和数据表设计: 1. 系统架构设计 前端界面:提供给学员、教练和管理员使用的Web界面或移动应用&#xf…

【高中数学/基本不等式】当x是正实数时,求函数f(x)=x/(1+x^2)的最大值?

【问题】 当x是正实数时&#xff0c;求函数f(x)x/(1x^2)的最大值&#xff1f; 【解答】 解&#xff1a; f(x)x/(1x^2)1/(x1/x))<1/2倍根号下(x*1/x)1/2 所以函数在[0,∞)的区域最大值为0.5 【函数图像】 f(x)x/(1x^2)是奇函数&#xff0c;没有断点&#xff0c;是可以…

idea推送到gitee 401错误

在idea上推送时遇到这样的问题&#xff0c;解决方法如下&#xff1a; 在https://的后面加上 用户名:密码 然后再提交就ok啦&#xff01;

使用qt creator配置msvc环境(不需要安装shit一样的宇宙第一IDE vs的哈)

1. 背景 习惯使用Qt编程的童鞋&#xff0c;尤其是linux下开发Qt的童鞋一般都是使用qt creator作为首选IDE的&#xff0c;通常在windows上使用Qt用qt creator作为IDE的话一般编译器有mingw和msvc两种&#xff0c;使用mingw版本和在linux下的方式基本上一样十分简单&#xff0c;不…

Alt与Tab切换窗口时将Edge多个标签页作为一个整体参与切换的方法

本文介绍在Windows电脑中&#xff0c;使用Alt与Tab切换窗口时&#xff0c;将Edge浏览器作为一个整体参与切换&#xff0c;而不是其中若干个页面参与切换的方法。 最近&#xff0c;需要将主要使用的浏览器由原本的Chrome换为Edge&#xff1b;但是&#xff0c;在更换后发现&#…

数据结构与算法笔记:实战篇 - 剖析微服务接口鉴权限流背后的数据结构和算法

概述 微服务是最近几年才兴起的概念。简单点将&#xff0c;就是把复杂的大应用&#xff0c;解耦成几个小的应用 。这样做的好处有很多。比如&#xff0c;这样有利于团队组织架构的拆分&#xff0c;比较团队越大协作的难度越大&#xff1b;再比如&#xff0c;每个应用都可以独立…

mybatis-plus参数绑定异常

前言 最近要搞个发票保存的需求&#xff0c;当发票数据有id时说明是发票已经保存只需更新发票数据即可&#xff0c;没有id时说明没有发票数据需要新增发票&#xff1b;于是将原有的发票提交接口改造了下&#xff0c;将调用mybatis-plus的save方法改为saveOrUpdate方法&#xff…

从零开始实现大语言模型(四):简单自注意力机制

1. 前言 理解大语言模型结构的关键在于理解自注意力机制(self-attention)。自注意力机制可以判断输入文本序列中各个token与序列中所有token之间的相关性&#xff0c;并生成包含这种相关性信息的context向量。 本文介绍一种不包含训练参数的简化版自注意力机制——简单自注意…