多维空间:理解复杂认知的关键

TLDR: 这篇综述讨论了如何通过多种降维技术揭示认知科学中的潜在表征空间,并探讨了选择适合研究目标的嵌入算法时需要考虑的关键因素。看完后发现,除了图结构、排序数据的降维让人印象深刻外,其它部分似乎缺乏新意。许多内容(比如模型表现、如何选择模型)虽然重要,但在讨论中没有带来新的洞见,反而略显乏味。

75228aa170c051aac7892616a29df164.png0018791f9e6f69afd0df42f8785621a4.png

DOI: 10.1016/j.tics.2024.07.005

1.认知科学为什么需要多维空间

认知科学常常面临一个核心挑战:认知表征无法直接进行观测。为了揭示大脑如何处理信息,科学家们通过分析可观测的数据——包括文本、神经影像、神经网络模型,人类行为表现——来推断这些潜在(latent)的表征空间。

这些潜在空间不仅揭示了大脑如何组织和处理信息,还能够回答一些古老的哲学问题,比如“两个不同的人是否以相同的方式感知红色?”更重要的是,模型化的表征还能揭示人们注意到什么、忽略了什么。例如,经验丰富的皮肤科医生能够迅速识别出恶性皮肤病变,而新手可能完全察觉不到这些诊断特征。

a97bec5b4b57a8228b54772c6429c878.png

提取潜在维度的方法种类繁多,统称为编码算法(encoding)或嵌入(embedding)算法,常用的有主成分分析(PCA)和t-SNE等。这些算法尽管目标相同,但在数据输入类型和输出维度的属性(如预测性能转换类型可解释性紧凑性)上存在显著差异。因此研究者需要根据具体研究目标选择合适的算法。

2.可观测数据映射到潜在空间产生了什么变化

在可观测空间中,每个维度都与现实中的物理特征紧密相关,例如皮层厚度等可量化的特征。这些维度帮助我们理解和测量现实世界中的现象。然而,当我们将这些可观测数据映射到潜在空间时,维度的意义发生了根本性的变化:a. 新的潜在维度并不一定对应于我们能够轻易解释的全局性特征; b. 这些潜在维度并不一定存在于现实世界中,它们是从输入数据中推断出来的潜变量。优秀的潜在维度是认知模型的核心

3. 选择嵌入算法时需要考虑的关键因素

不同的算法优化的属性各不相同,因此没有一个单一的潜在空间可以被认为是绝对正确的。相反,最合适的潜在空间应该是最契合研究问题的那个。例如,Big Five人格量表和HEXACO量表都提供了描述人格特质的低维度空间,但HEXACO在预测道德和伦理行为方面可能表现得更好。

选择嵌入算法时需要考虑五个关键因素。首先,在输入方面,需要选择适合输入数据结构的算法。其次,在输出方面,不同算法优先考虑的潜在空间属性有所不同,这些属性包括:预测性能转换类型可解释性紧凑性。表1👇总结了一些常用嵌入算法及其属性

057f166b03cb39ef283d9bde70d1293f.png

3.1 输入的相关因素

主要包括三个需要考虑的因素

  • 数据源:不同的数据源会对后续的分析和嵌入算法选择产生显著影响。

  • 数据预处理:预处理步骤的质量和方式直接影响到最终的潜在空间表示,因此在进行数据预处理时需要特别谨慎。

  • 数据类型:输入数据的结构形式也是一个重要的考虑因素。数据可以以多种形式存在,例如,作为一个多维数据表(如PCA处理的多维数据),一组序数关系(如人类偏好判断),一个节点和边的图结构,或大规模文本数据。数据类型的选择将影响嵌入算法的选择,因为不同的算法在处理不同类型的数据时有着不同的优势和局限性。

数据的类型不仅限于我们熟悉的数值数据,还可能是:

分类/排序数据(图1E)。一个常见的数据来源是通过收集人类的相似性判断来获得的(例如,刺激Q比刺激B更像刺激A)。针对这种类型的数据,存在一系列多样化的嵌入算法,它们能够将这些序数相似性判断转换为多维表示,其中每个刺激都在潜在空间中表示为一个点。这些算法中的许多没有正式名称,但通常归类于多维尺度法或心理嵌入方法。推断出的潜在维度可以量化“心理距离”的概念,即在潜在空间中,相似的项目会出现在彼此接近的位置(如图1E所示)。类似的嵌入算法也应用于其他类型的非数值数据,例如分类混淆矩阵(categorization confusion matrices)、成对评分(pairwise ratings)、找出异类的判断(odd-one-out judgments)、排列数据(arrangement data)以及非人类的实验范式。

文本语料库(图1F)。嵌入算法还可以处理文本语料库,从而生成多维的词嵌入和句子嵌入。词嵌入算法统计一对词语在指定窗口内共同出现的频率(如图1F所示)。在相似上下文中共同出现的词语通常具有相似的意义。

图结构(图1D)。图结构可以嵌入到多维空间中。例如,通过利用双曲空间的属性,层次图可以嵌入到多维空间中,相比欧几里得空间,在建模层次数据时,双曲空间往往需要更少的维度。一些行为数据(如气味)被证明可以很好地用双曲空间描述。

6b2fba506e7a771b411225b959c63c00.png

(Hyperbolic geometry of the olfactory space)

97144b99d99daa7000871a5d2fb2d897.png

图1展示了通过不同数据集推导出的六种不同形式的潜在维度,涵盖了从线性到非线性、从多维数据到文本语料库的广泛应用。

  • 图1A显示了通过主成分分析(PCA)得到的线性且正交的潜在维度,这些维度彼此独立,不存在相关性。

  • 图1B则展示了独立成分分析(ICA)生成的线性但非正交的潜在维度,允许各维度之间存在一定的相关性。

  • 图1C展示了通过非线性方法(如ISOMAP、t-SNE或UMAP)推导出的潜在维度,这些维度在原始空间中呈现出弯曲和扭曲的形态,用于捕捉数据中的复杂非线性关系。

  • 图1D则展示了从层次结构图中推导出的潜在维度,这些维度被嵌入到双曲空间中,以更有效地表示层次结构。

  • 图1E描述了基于序数相似关系推导出的潜在维度,展示了如何在心理距离的概念下,将相似的项目表示为彼此接近的点。

  • 图1F展示了通过分析文本语料库推导出的潜在维度,基于词语的共现频率,在多维空间中表示出词语之间的相似性。

整个图1全面展示了不同嵌入算法如何生成各自独特的潜在维度,以及这些维度在揭示数据结构中的重要作用。

3.2 输出的相关因素

模型表现:指的是嵌入算法能保留输入数据关键信息并进行有效泛化。

转换类型:转换类型可以通过嵌入转换的线性程度和维度变化来描述。常见的线性转换方法包括PCA、ICA、傅里叶变换、因子分析和基于张量的降维方法。对于线性方法,降维通常涉及识别解释方差最多的一组潜在维度,并排除剩余的维度。常用的非线性降维算法包括ISOMAP、t-SNE、UMAP和各种自编码器。其他非线性降维算法还包括核方法、局部线性嵌入、拉普拉斯特征映射、Hessian特征映射和局部切空间对齐。非线性降维算法通常假设数据并非均匀分布,而是分布在较为连续的曲面(即流形)上。非线性转换(如t-SNE)允许新维度描述一个截然不同的空间,可能在原始空间中扭曲和转动。

可解释性:可解释性分为两种形式。强可解释性指的是每个维度都有独立于其他维度的清晰解释。强可解释性可以理解为全局可解释性:无论在维度的哪个位置,这种解释都适用。相比之下,一个维度可能只有局部可解释性:即维度的解释随着你沿着维度逐步移动而变化。图2帮助我们理解在不同的分析和建模场景中,选择何种类型的潜在空间是最合适的。

8b8cbcf77a0d2559529434dd63eb2d2a.png

图2展示了不同类型的潜在空间及其在可解释性和维度变化上的差异。在全局可解释的潜在空间(图2A)中,每个维度都有明确且一致的含义,无论在空间中的哪个位置,这种解释性都保持不变,这对于建模和分析非常有用。相比之下,局部可解释的潜在空间(图2B)显示,维度的解释随着位置的变化而变化,虽然在某些局部范围内具有清晰的解释,但在整个空间内可能会有所不同。这种情况在处理复杂、非线性数据时较为常见。非线性嵌入的潜在空间(图2C)则展示了数据在更复杂的结构中分布的方式,维度的含义可能随着位置变化而剧烈变化,虽然它能更好地捕捉数据中的非线性关系,但维度的解释性较弱。

紧凑性:研究者可能会选择一个低维度且局部可解释的空间,或是一个高维度且全局可解释的空间。虽然这两种方法可能同样适合输入数据,但它们恢复出的维度数量会有所不同。

作者提出进行内在维度性分析(比如使用常见的碎石图)。内在维度性(Intrinsic Dimensionality)是指数据集在某种意义上最小的必要维度数,能够用来描述数据的核心结构或特征,而不丢失重要信息。例如,使用PCA分析某个数据集时,你可能会发现,前两个主成分解释了几乎所有的方差(例如,99%以上),而第三个主成分解释的方差非常少。这表明数据的内在维度性是二维的。

4. 比较和选择嵌入空间

在比较和选择嵌入空间时,研究者需要权衡不同算法的特性,直接比较候选空间可以揭示它们之间的相似性和差异,进而识别出哪种空间更适合特定的研究目标。通过评估嵌入空间在下游任务中的表现,可以间接比较这些空间的优劣,但需要注意嵌入坐标与可观测行为之间的映射过程。最终,选择最合适的嵌入空间应基于对比多种方法的结果,并考虑特定的研究需求和数据特点。

Outstanding questions

  • 大脑在多大程度上在维度空间进行运算?

  • 大脑是否同时使用不同类型的维度空间?一种可能性是,不同脑区的表征空间根据功能和情境的不同而有所差异。

  • 大脑的维度空间是否可以随着任务环境的变化而变化并按需组装? 


f4bf2e95772c42dad79c651916a582bb.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1523402.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

AUTO TECH 2025 广州国际新能源汽车功率半导体技术展览会

AUTO TECH 2025 广州国际新能源汽车功率半导体技术展览会 The 12th China Guangzhou EVs Power Electronics technology Expo 时间:2025年11月20日-22日 地点:广州保利世贸博览馆 (PWTC Expo) 亚洲领先的车用功率半导体技术专业展;是与…

C++面向对象详解(上)

类的定义 class 类名{ //成员变量 //成员方法 } C实现的第一个小案例 通过这个案例我们可以了解到C独有的特点,优点:方法和变量放在了一起,优化了代码的调用,如果在C语言中我们函数调用还要写上函数的返回类型,在C中&…

手把手教你对接旺店通旗舰版API拉取国内电商店铺订单数据

前言 做国内电商的公司通常会使用比如旺店通这类ERP拉取和分析自己店铺的订单数据,并且可能需要进一步将ERP的订单数据拉取到公司自己做的后台做更个性化的数据分析和需求。这篇博客我以旺店通旗舰版为例,讲解如何通过他们API拉取订单数据到本地。 准备…

热点王炸模型!准确率高达100%!Transformer+GASF+RP-1D-2D-GRU 小白也能发一区!创新性拉满!

适用平台:Matlab2023b版及以上 参考文献一:中文EI期刊 《西安交通大学学报》 文献:《采用格拉姆角场-卷积神经网络-时序卷积网络混合模型的锂离子电池健康状态估计》中的①时序图像融合模型;②一维时序转格拉姆角场模型。参考文献…

如何用 Typed.js 制作炫酷的打字效果?

前言 在前端开发的世界中,动态和交互性是用户体验的关键。 Typed.js 是一个轻量级的 JavaScript 库,它能够以编程方式模拟打字效果,为网页增添动态的文本展示。 这篇文章将带你深入了解 Typed.js 的魔力,探索它如何为前端开发带…

【PyTorch】深入解析 `with torch.no_grad():` 的高效用法

🎬 鸽芷咕:个人主页 🔥 个人专栏: 《C干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 文章目录 引言一、with torch.no_grad(): 的作用二、with torch.no_grad(): 的原理三、with torch.no_grad(): 的高效用法3.1 模…

IOS 21 发现界面(UITableView)单曲列表(UITableView)实现

发现界面完整效果 本文实现歌单列表效果 文章基于IOS 20 发现界面(UITableView)歌单列表(UICollectionView)实现 继续实现发现界面单曲列表效果 单曲列表Cell实现 实现流程: 1.创建Cell,及在使用UITable…

如何使用 Mistral 和 Llama2 构建 AI 聊天机器人

开始使用 Mistral 让我们从 Mistral 7B Instruct 的 GGUF 量化版本开始,并使用 AutoClasses ‘AutoModelForCausalLM’ 之一来加载模型。AutoClasses 可以帮助我们自动检索给定模型路径的模型。AudoModelForCausalLM 是具有因果语言建模的模型类之一,这…

【STM32+HAL库】---- 驱动DHT11温湿度传感器

硬件开发板:STM32F407VET6 软件平台:cubemaxkeilVScode1 DHT11工作原理 1.1 简介 DHT11温湿度传感器是一种数字式温湿度传感器,其工作原理基于集成了湿度感测元件和NTC温度感测元件的传感器模块。以下是DHT11温湿度传感器的工作原理&#x…

SQL - SQL优化

在sql查询中为了提高查询效率,我们常常会采取一些措施对查询语句进行sql优化,下面总结的一些方法,有需要的可以参考参考 一、查询SQL尽量不要使用select *,而是具体字段 // 建议 SELECT id,user_name,age,tel FROM user// 不建议…

同城便民信息生活小程序源码系统 求职招聘+房产出租+相亲交友 带完整的安装代码包以及搭建部署教程

系统概述 同城便民信息生活小程序源码系统是一款专为满足城市居民多元化需求而设计的综合性服务平台。该系统通过整合求职招聘、房产出租、相亲交友等核心功能模块,旨在打造一个集信息发布、查询、交流于一体的闭环生态系统。用户可以在小程序内轻松发布或浏览各类…

【STM32+HAL库】---- 驱动MAX30102心率血氧传感器

硬件开发板:STM32F407VET6 软件平台:cubemaxkeilVScode1 MAX30102心率血氧传感器工作原理 MAX30102传感器是一种集成了红外光源、光电检测器和信号处理电路的高度集成传感器,主要用于心率和血氧饱和度的测量。以下是MAX30102传感器的主要特点…

使用光敏电阻设计照度计

照度计是一种使用 SI 单位勒克斯测量照度和光发射度的设备。它有效地测量落在给定面积单位上的光的功率量,不同之处在于功率测量被加权以反映人眼对不同波长的光的敏感度。描述照度计的一种更简单的方法是,它测量落在传感器上的光的亮度。市售照度计的价…

使用PyTorch从零构建Llama 3

我们上次发了用PyTorch从零开始编写DeepSeek-V2的文章后,有小伙伴留言说希望介绍一下Llama 3。那么今天他就来了,本文将详细指导如何从零开始构建完整的Llama 3模型架构,并在自定义数据集上执行训练和推理。 [图1]:Llama 3架构展示…

Linux/Ubuntu服务器 screen 安装与使用

一、screen简单介绍 在Linux系统中,screen是一个非常强大的终端仿真器,它允许用户在一个终端窗口中创建多个子窗口,每个子窗口都可以运行一个独立的会话。screen的主要特点包括: 会话分离:screen允许用户在终端会话中运…

宝宝护眼灯哪个牌子好?2024年热门宝宝护眼灯款式推荐

宝宝护眼灯哪个牌子好?在日常生活的点点滴滴中,适宜的灯光扮演着至关重要的角色,无论是学习还是办公等环境,皆需要恰当的照明。为此,人们通常会备上一款台灯,特别是对于长期与电脑为伴的设计师、影像绘图专…

爆改YOLOv8|利用yolov10的C2fCIB改进yolov8-高效涨点

1,本文介绍 本文介绍了一种改进机制,通过引入 YOLOv10 的 C2fCIB 模块来提升 YOLOv8 的性能。C2fCIB 模块中的 CIB(Compact Inverted Bottleneck)结构采用了高效的深度卷积进行空间特征混合,并使用点卷积进行通道特征…

【unity知识】Animator动画状态的基本属性介绍

文章目录 动画状态的基本属性1、标签Tag2、Motion 该状态所管理的动画片段3、speed 动画的播放速度4、Motion Time 播放动画片段定在一个特定时间点5、Mirror镜像动画6、CycleOffset动画偏移7、FootIK8、Write Defaults 参考完结 动画状态的基本属性 1、标签Tag 通过打标签我们…

AI大模型时代,产品经理需要了解什么?

在移动互联网高速发展的时代,产品经理一度成为最火爆的职业,人人都想当产品经理,有很多人说:产品经理的上限极高,它应该是CEO式的岗位。事实上,我们看到新型互联网科技公司的CEO也确实都是产品出身。但是这…

数据库审计是什么?主要用在哪些场景呢?

数据库审计是什么?主要用在哪些场景呢? 数据库审计 数据库审计是指对数据库系统中的操作进行记录、监控和分析的过程,用于检查和评估数据库的安全性、合规性和完整性。数据库审计可以为组织提供重要的安全保障和合规性需求的满足。本文将介…