Faces in Things数据集: 由麻省理工学院、微软等联合发布,探索人类视觉错觉的新里程碑

2024-09-24,由麻省理工学院、微软、丰田研究院、NVIDIA联合发布的 Faces in Things,为我们打开了研究人类视觉错觉——尤其是面部错觉(Pareidolia)的新篇章。专注于人类视觉系统如何在各种随机刺激中检测到类似面孔的结构,例如在咖啡污渍或天空中的云朵中看到面孔。

 数据集地址:Faces in Things|计算机视觉数据集|人脸检测数据集

一、背景:

人类视觉与错觉 在人类视觉系统中,我们对检测面孔非常敏感,这在进化上具有明显的优势,比如更容易在灌木丛中发现未知的捕食者。然而,这也导致了错误的人脸检测。面部错觉(Face pareidolia)描述了在其他随机刺激中感知到类似面孔的结构的现象。

现有研究的局限 尽管人类和动物都会经历面部错觉,但这种现象在计算机视觉系统中尚未得到充分研究。

目前遇到的困难和挑战:

1. 人类与机器的差异:人类和机器在面部错觉检测方面存在显著的行为差异。

2. 进化需求:人类检测动物面孔的需求可能解释了这种差异的一部分。

数据集地址:Faces in Things|计算机视觉数据集|人脸检测数据集

二、让我们一起看一下Faces in Things 数据集

Faces in Things数据集:一个包含五千张网络图片的面部错觉图像数据集,利用这个数据集,研究人员检验了最先进的人脸检测器是否也会展现出面部错觉,并发现了一个显著的行为差距。

1. 数据集的建立:首次创建了一个大规模的面部错觉数据集,为面部错觉的研究提供了直接支持。

2. 行为差距的发现:通过实验发现,即使是最先进的人脸检测器,在没有经过专门训练的情况下,也难以很好地检测到面部错觉。

3. 统计模型的提出:提出了一个简单的面部错觉统计模型,并通过实验验证了模型的关键预测。

数据集的构建:

1. 样本收集:从LAION-5B数据集中采样候选错觉图像,并使用CLIP检索构建原始图像集。

2. 详细注释:每张图片都包含了人脸的边界框和基本面部属性。

3. 任务设计:数据集支持多种面部检测模型的研究。

4. 数据集分割:随机将数据集分为训练集(70%)和测试集(30%)

数据集特点

1. 多任务:"Faces in Things"数据集可以用于多种面部检测任务。

2. 高质量:通过人工标注,确保了数据集的高质量。

3. 跨数据集泛化:在不同的数据集上进行测试,验证了模型的泛化能力。

三、让我们一起展望 Faces in Thing数据集的应用

比如,我是一名心里咨询师。

哎呀,我之前做心理咨询的时候,遇到很多害怕社交的客人。他们一想到要跟人打交道,心就怦怦跳,紧张得不行。以前,我得用各种方法帮他们克服这种焦虑,比如角色扮演啊,慢慢习惯面对面的交流。

自从发现集成Faces in Things这个数据集的智能系统

我的工作就有了新的突破。这里面有成千上万的图片,都是些看起来像脸的东西,但又不完全是真正的脸。有的是在咖啡渍里,有的是在云彩里,反正就是各种奇奇怪怪的地方。

我用这些图片给来访者做训练。一开始,他们看到这些模糊的、像脸一样的图像,心里也是七上八下的。但慢慢地,他们开始学会怎么去分辨这些错觉,知道哪些是真的人脸,哪些只是看起来像而已。

这样做了一段时间后,来访者告诉我,他们在现实生活中好像也没那么害怕了。他们开始能更好地读懂别人的表情,知道什么时候该说话,什么时候该听。这就像是解锁了他们心里的一把锁,让他们在社交场合中更自在了。

通过这些面孔错觉的练习,我的来访者现在可以更自信地面对人群,享受社交的乐趣了。这种感觉真的是太棒了!

让我们一起走进:Faces in Things|计算机视觉数据集|人脸检测数据集

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/804.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

知识见闻 - Workday公司介绍

人力资源“一哥”Workday的前世今生 01 Duffield 既然要聊Workday,我们首先要认识一个人。David Duffield,又一位企业软件服务行业的绝对大神。 大卫杜菲尔德(David Duffield)出生于1941年。 40岁,很多职场人都已经认命…

宁德时代嵌入式面试题及参考答案(万字长文)

vector 和 list 的主要区别是什么? 向量(vector)和链表(list)是 C 中两种常用的容器。 从底层数据结构来讲,vector 是基于连续的内存存储的动态数组。这使得它可以通过索引快速访问元素,时间复杂…

设计模式08-行为型模式1(命令模式/迭代器模式/观察者模式/Java)

五、行为型模式 **行为模式的定义:**行为型模式是对不同的对象之间划分职责和算法的抽象化。行为型模式定义了系统中对象之间的交互与通信,研究系统在运行时对象之间的相互通信与协作,进一步明确对象的职责,包括对系统中较为复杂的…

【设计模式】结构型模式(二):代理模式

结构型模式(二):代理模式 3.代理模式(Proxy)3.1 主要特点3.2 组成部分3.3 示例代码3.3.1 Subject 接口3.3.2 RealSubject 实际对象3.3.3 Proxy 代理对象3.3.4 客户端代码3.3.5 运行结果 3.4 总结 3.代理模式&#xff0…

第二十八章 Vue之自定义指令

目录 一、引言 二、自定义指令的注册和使用方式 2.1. 自定义指令-全局注册使用 2.2. 自定义指令-局部注册使用 三、自定义指令完整代码 3.1. 自定义指令全局注册/使用 3.1.1. main.js 3.1.2. App.vue 3.2. 自定义指令局部注册/使用 3.2.1. main.js 3.2.2. App.vue …

Charles简单压力测试

1.接口请求次数,并发量,请求延迟时间均可配置 1.1选中需要进行测试的接口,鼠标右键选中【repeat advance】 2.设置并发参数 下面的图中,选择了1个接口,每次迭代中1个接口同时请求,迭代1000次(…

【uniapp3】分享一个自己写的h5日历组件

简言 分享一下自己基于uniapp写的日历组件。如果不太满足你的需求,可以自己改造。 日历 实现分析: 页面显示 - 分为顶部显示和日历显示,我这里做了多行和单行显示两种情况,主要是当时看着手机的日历做的,手机上的…

Java设计模式(代理模式整理中ing)

一、代理模式 1、代理模式定义: 代理模式:由于某些原因要给某对象提供一个代理以控制对该对象的访问,这时访问对象不适合或者不能够直接引用目标对象,代理对象作为访问对象与目标对象之间的中介进行连接调控调用。 2、代理模式的…

Thumb 汇编指令集,Thumb 指令编码方式,编译 Thumb 汇编代码

版权归作者所有,如有转发,请注明文章出处:https://cyrus-studio.github.io/blog/ Thumb指令集 ARM 指令集:最早在 1985 年随第一代 ARM 处理器问世。ARM 指令集一开始是 32 位固定长度的指令,用于各种计算任务。 Thu…

Leetcode - 周赛421

目录 一,3334. 数组的最大因子得分 二,3335. 字符串转换后的长度 I 三,3336. 最大公约数相等的子序列数量 四,3337. 字符串转换后的长度 II 一,3334. 数组的最大因子得分 暴力方法就不演示,这里介绍一个…

文件管理工具的按路径名称归类功能大公开,将大量文件批量复制或移动到指定路径,办公软件达人的秘密武器

是否还在为成堆的文件归类而苦恼?想要一键就能将海量文件按路径名称轻松归类,无论是复制还是移动?别急,今天就让文件批量改名高手软件的按路径名称归类功能来拯救你的文件管理世界!让我们一起告别繁琐,迎接…

建设NFS服务器并实现文件共享

关闭防火墙和s0 systemctl stop firewalld setenforce 0 安装NFS yum install nfs-utils -y 新建共享目录并设置权限 echo "hello" > /nfs/shared/test1 chmod -Rf 777 /nfs/shared/ 配置服务端的NFS配置文件 vim /etc/exports /nfs/shared *(ro) 启动…

曹操出行借助 ApsaraMQ for Kafka Serverless 提升效率,成本节省超 20%

本文整理于 2024 年云栖大会主题演讲《云消息队列 ApsaraMQ Serverless 演进》,杭州优行科技有限公司消息中间件负责人王智洋分享 ApsaraMQ for Kafka Serverless 助力曹操出行实现成本优化和效率提升的实践经验。 曹操出行:科技驱动共享出行未来 曹操…

(转载)Tools for Learning LLVM TableGen

前提 最近在学习有关llvm的东西,其中TableGen占了一部分,所以想特意学习下TableGen相关的语法。这里找到了LLVM官网的一篇介绍TableGen的博客,学习并使用机器翻译为中文。在文章的最后也添加了一些学习TableGen的资源。 原文地址&#xff1…

vue3uniapp实现自定义拱形底部导航栏,解决首次闪烁问题

前言: 我最初在网上翻阅查找了很多方法,发现大家都是说在page.json中tabbar中添加:"custom": true,即可解决首次闪烁的问题,可是添加了我这边还是会闪烁,因此我这边改变了思路,使用了虚拟页面来解…

【P2-5】ESP8266 WIFI模块在AP模式下作为TCP服务器与多个电脑/手机网络助手(TCP客户端)通信——TCP数据透传

前言:完成ESP8266 WIFI模块在AP模式下作为TCP服务器与多个电脑/手机网络助手(TCP客户端)通信——实现TCP数据透传 AP模式,通俗来说模块可以发出一个WIFI热点提供给电脑/手机连接。 TCP服务端,通俗来说就是模块/单片机作为服务器,可以接收多个客户通道的连接。 本…

Kali Linux 新工具推荐: Sploitscan

在 2024.2 版本 Kali Linux 增加了一个新攻击工具: Sploitscan 1.简介: Sploitscan 能够发现操作系统和应用程序中的安全漏洞。 2.特点: 简单的命令行界面 扫描多个操作系统和应用程序 检测多种漏洞 提供详细信息 可定制性强 3.示例: 2024.2 及以后的版本 Kali Linux…

11.Three.js使用indexeddb前端缓存模型优化前端加载效率

11.Three.js使用indexeddb前端缓存模型优化前端加载效率 1.简述 在使用Three.js做数字孪生应用场景时,我们常常需要用到大量模型或数据。在访问我们的数字孪生应用时,每次刷新都需要从web端进行请求大量的模型数据或其他渲染数据等等,会极大…

基于PyTorch的大语言模型微调指南:Torchtune完整教程与代码示例

近年来,大型语言模型(Large Language Models, LLMs)在自然语言处理(Natural Language Processing, NLP)领域取得了显著进展。这些模型通过在大规模文本数据上进行预训练,能够习得语言的基本特征和语义,从而在各种NLP任务上取得了突破性的表现。为了将预训练的LLM应用于特定领域…

探索Unity:从游戏引擎到元宇宙体验,聚焦内容创作

unity是实时3D互动内容创作和运营平台,包括游戏开发、美术、建筑、汽车设计、影视在内的所有创作者,借助Unity将创意变成现实。提供一整套完善的软件解决方案,可用于创作、运营和变现任何实时互动的2D和3D内容,支持平台包括手机、…