《机器学习by周志华》学习笔记-神经网络-05RBF径向基函数网络

1、背景

1988年,Broomhead和Lowe用径向基函数(Radialbasis function, RBF)提出分层网络的设计方法,从而将神经网络的设计与数值分析和线性适应滤波相挂钩。

2、概念

RBF(Radial Basis Function,径向基函数)网络是一种单隐层前馈神经网络,即该网络只有3层,输入层、隐含层、输出层。

  • 输入层:由一些感知单元组成,他们将网络与外界环境连接起来。
  • 隐含层:只有一层,采用「径向基函数」作为激活函数,作用是从输入空间到隐含层空间之间进行「非线性」变换。大多情况下,隐含层空间具有较高的维度。
  • 输出层:作用是给输入层的激活模式提供响应,是输入的径向基函数和神经元参数的线性组合。

径向基函数(RBF)的概念:

在神经网络背景下,隐藏单元提供一个「函数」集,该函数集在「输入模式向量扩展至隐含层空间」时,为其构建了一个任意的「基」,这个函数集中的函数就被称为「径向基函数」。

其实就是某种沿径向对称的标量函数。通常定义为空间中任意点X到某中心C之间欧氏距离的单调函数。

欧氏距离\rho

也称为欧几里得度量,是一个通常采用的距离定义。指m维空间中两个点之间的真实距离。或者向量的自然长度。

2维空间的表达式:中心点C(c_{1},c_{2}),任意点X(x_{1},x_{2})

\rho(X,C) =\sqrt{(x_{1}-c_{1})^{2}+(x_{2}-c_{2})^{2}}

3维空间表达式:中心点C(c_{1},c_{2},c_{3}),任意点X(x_{1},x_{2},x_{3})

\rho(X,C) =\sqrt{(x_{1}-c_{1})^{2}+(x_{2}-c_{2})^{2}+(x_{3}-c_{3})^{2}}

同理:m维空间表达式:中心点C(c_{1},c_{2},...,c_{m}),任意点X(x_{1},x_{2},...,x_{m})

\rho(X,C) =\sqrt{(x_{1}-c_{1})^{2}+(x_{2}-c_{2})^{2}+...+(x_{m}-c_{m})^{2}}=\sqrt{\sum_{i=1}^{m}(x_{i}-c_{i})^{2}}

2、作用

径向基函数方法在某个程度上利用了多维空间中传统的「严格插值法」的研究成果。由于它模拟了人脑中局部调整、相互覆盖接受域(也称为感受域Receptive Field,RF),因此RBF网络是一种局部逼近网络,现已证明它能以任意精度逼近任意连续函数。

主要是为了解决「多变量插值」问题

3、推理

假定输入为d维向量X=(x_{1},x_{2},...,x_{d}),输出为实值,则RBF网络可以表示为:

\varphi (X)=\sum_{h=1}^{q}\omega _{h}\rho (X,C_{h})

其中:

q:为隐藏层神经元个数

C_{h}:为隐含层第h个神经元所对应的中心点,向量表示为C_{h}=(c_{h}^{1},c_{h}^{2},...,c_{h}^{d})

\omega _{h}:为隐含层第h个神经元的权重

\rho (X,C_{h}):为径向基函数,也就是样本X到数据中心C_{h}之间欧氏距离的单调函数。本次我们采用常用的「高斯径向基函数」作为径向基函数使用。

高斯径向基函数:

(1)数据表达式:

\phi (\rho )=e^{-\epsilon \rho ^{2}}

        其中:\rho为输入向量与中心点之间的距离,\epsilon是一个控制函数形状的参数

(2)特点:

        ①局部性:在距离中心较近的地方具有较大的值,在距离中心较远的地方迅速衰减为零。具有局部相应的特征能够很好的捕捉局部的特征,可见下图:   

        ②光滑性:具有无限可微性,即在任何点处都是光滑的,具有较好的稳定、收敛。

        ③灵活性:通过调整参数\epsilon,可以控制函数的宽度和形状。

(3)参数\epsilon

        ①宽度控制:\epsilon决定了高斯径向函数的宽度。当\epsilon较大,函数曲线较宽,衰减较慢;当\epsilon较小,函数曲线较窄,衰减较快。

𝟄1>𝟄2

        ②局部调节: 较小的\epsilon使函数更加局部化(对远处的数据点影响很小),较大的\epsilon使函数更加整体化(对远处的数据点影响增加);

(4)作用:

        ①作为相似性的度量:根据点与中心点之间的距离,计算不同点的相似性。距离中心点较近的点函数值较大,相似度更高。反之,相似度低。       

        ②构建聚类中心:通过所有点的的加权求和得到软聚类中心,每个点可以看作对聚类中心的贡献。在数据密集的区域,聚类中心更加集中;在数据稀疏的区域,聚类中心更加分散。

        ③实现数据的平滑和降维:平滑处理可以减少噪声和异常值的干扰,平滑后的数据对后续的聚类分析更加有利,提高聚类的稳定性和可靠性。利用高斯径向基函数也可以将高维数据映射到低维空间实现数据的降维,降维后可以很好的保留数据的主要特征且降低计算复杂度。便于可视化和理解数据的结构信息。

        ④提高聚类的灵活性和适应性:该函数具有强大的非线性映射能力,能够将非线性问题转化为线性,提高聚类的通用性质。可以通过选择不同的\epsilon值控制聚类的颗粒度,增加或减少基函数的数量来调整聚类的复杂度。

本次研究结合上文径向基函数的概念,我得到函数如下:

\rho (X,C_{h})=e^{-\epsilon _{h}\left \| X-C_{h} \right \|^{2}}

具有足够多隐含层神经元的RBF网络能以任意精度逼近任意连续函数。

将上述函数代入RBF网络表达式,可得:

\varphi (X)=\sum_{h=1}^{q}\omega _{h}e^{-\epsilon _{h}\left \| X-C_{h} \right \|^{2}}

4、训练过程

4.1、第一步:确定隐含层神经元中心C_{h},其基本方法如下

        ①随机采样选取:就是从数据中随机选择一些数据点作为隐含层神经元的中心点。适用于对数据的分布没有先验知识,且数据量较大。因为在大数据量的情况下,随机选择是有很大概率可以覆盖到数据的不同区域,为隐含层提供一个相对合理的初始中心点。

        ②基于数据聚类的方法:

                K-means聚类方法:确定隐含层神经元数量之后使用K-means算法岁输入的数据进行聚类,聚类完成之后每个聚类的中心就可以作为每个隐藏层神经元的中心点。他的优势是可以根据数据的分布自动找到相对密集的区域作为中心点,这些中心点能够较好的反应数据的局部特征。局限是它的假设数据是球型分布数据,非球形的数据可能效果不佳。

案例说明:将以下10个一维向量点聚为3类

序号点(key)点(value)
1A11
2B15
3C3
4D9
5E9
6F5
7G3
8H0
9I2
10J2

①选中心点初始值为center1=3center2=5center3=10

②求出以上10个点距3个中心点center1=3center2=5center3=10的距离,并选出10个点距离最近的中心点,如下表所示:

序号点(key)点(value)center1=3的距离center2=5的距离center3=10的距离最近中心点(距离最小)
1A11|11-3|=8|11-5|=6|11-10|=1center3=10
2B15|15-3|&#

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/5720.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

11.1组会汇报-基于区块链的安全多方计算研究现状与展望

基础知识 *1.背书,这个词源来自银行票据业务,是指票据转让时,原持有人在票据背面加盖自己的印鉴,证明该票据真实有效、如果有问题就可以找原持有人。 区块链中的背书就好理解了。可以简单的理解为验证交易并声明此交易合法&…

MSC“名实之辩”:精准鉴定只为精准治疗

前 言 MSC是一群来源广泛、能够体外增殖分化的异质性细胞。MSC具有免疫调节、促进组织修复等作用,应用于多种疾病的治疗。由于科学进程、习惯等原因,MSC具有多种名称。自先秦以来,就有“名实之辩”,今日我们就讲一讲MSC的名称与…

CST联合Isight进行天线DOE设计

本期我们转载一篇国外工程师Matthias MEIENHOFER,利用CST和Isight联合进行DOE设计的案例。 本文通过模拟设计一个双频带(GSM和WLAN)天线来研究天线的几何尺寸变化和性能的关系。如果我们改变天线里的某些宽度或长度参数,天线的性…

微信小程序寓言童话创作APP设计与实现

文章目录 项目介绍具体实现截图技术介绍mvc设计模式小程序框架以及目录结构介绍错误处理和异常处理java类核心代码部分展示详细视频演示源码获取 项目介绍 本文通过对现有寓言童话创作APP的调研和分析,取其精华去其糟粕,遵循软件工程方法进行系统分析、…

越来越多人不喜欢十六薪了

十六薪是个坑 大家好,我是青玉白露。 最近刷各种论坛,发现有个有意思的职场现象。 不少人开始对"十五薪"、“十六薪”敬而远之。 曾经让人眼红的福利,现在却成了让人望而却步的"坑"。这是咋回事呢? 乍一看,十五薪确实挺诱人。比如月薪3万,年收…

【命令执行waf绕过】

一、绕过空格 二、绕过黑名单 三、绕过长度限制 四、练习 发现了两个文件,cat读取,但是被过滤了: 用 I F S IFS IFS绕过读出index的源码,发现过滤了很多东西,黑名单过滤: 字符串拼接绕过: …

MongoDB笔记02-MongoDB基本常用命令

文章目录 一、前言二、数据库操作2.1 选择和创建数据库2.2 数据库的删除 3 集合操作3.1 集合的显式创建3.2 集合的隐式创建3.3 集合的删除 四、文档基本CRUD4.1 文档的插入4.1.1 单个文档插入4.1.2 批量插入 4.2 文档的基本查询4.2.1 查询所有4.2.2 投影查询(Projec…

六、SpringMVC的视图

文章目录 1. ThymeleafView2. 转发视图3. 重定向视图4. 视图控制器view-controller 1. ThymeleafView 2. 转发视图 3. 重定向视图 4. 视图控制器view-controller

springboot系列十三: 异常处理

springboot异常处理 基本介绍拦截器VS过滤器默认异常页面应用实例debug取出状态码和错误信息 全局异常基本说明应用实例Debug处理流程 自定义异常基本说明应用实例Debug处理流程注意事项和细节 基本介绍 1.默认情况下,SpringBoot 提供 /error 处理所有错误的映射&a…

无人机手势控制工作原理和算法!

一、无人机手势控制的工作原理 无人机手势控制的工作原理基于计算机视觉技术和图像识别技术。具体来说,无人机上配备的摄像头会捕捉用户的手势动作,并将这些图像数据传输到无人机内置的处理器中。处理器通过内置的算法对图像进行处理和解析,…

雷池社区版 7.1.0 LTS 发布了

LTS(Long Term Support,长期支持版本)是软件开发中的一个概念,表示该版本将获得较长时间的支持和更新,通常包含稳定性、性能改进和安全修复,但不包含频繁的新特性更新。 作为最受欢迎的社区waf&#xff0c…

自动驾驶---理想汽车智驾进展

1 背景 自媒体---“电车通”从2024年初开始推出智能化评测相关栏目,尤其是针对智能驾驶这一功能做了大量的实测工作;根据综合表现,给测试车型给出了能够直观展示其能力的评分。当评测的对象达到一定数量后,对整个国内车市智驾能力…

跨越科技与文化的桥梁——ROSCon China 2024 即将盛大开幕

在全球机器人技术飞速发展的浪潮中,ROS(Robot Operating System)作为一款开源的机器人操作系统,已成为无数开发者、研究人员和企业的首选工具。为了进一步推动ROS的应用与发展,全球知名的机器人操作系统会议——ROSCon…

制作并量化GGUF模型上传到HuggingFace和ModelScope

llama.cpp 是 Ollama、LMStudio 和其他很多热门项目的底层实现,也是 GPUStack 所支持的推理引擎之一,它提供了 GGUF 模型文件格式。GGUF (General Gaussian U-Net Format) 是一种用于存储模型以进行推理的文件格式,旨在针对推理进行优化&…

docker+nacos

安装数据库 以docker安装为例(实际建议实体) 初始化数据库 /******************************************/ /* 数据库全名 nacos_config */ /* 表名称 config_info */ /******************************************/ CREATE TABLE config_i…

Linux入门(2)

林纳斯托瓦兹 Linux之父 1. echo echo是向指定文件打印内容 ehco要打印的内容,不加任何操作就默认打印到显示器文件上。 知识点 在Linux下,一切皆文件。 打印到显示器,显示器也是文件。 2.重定向 >重定向操作,>指向的…

PL端:HDMI 输出实验

实验环境 vivado 2024.1 实验任务 做一个 HDMI 输出的彩条 硬件介绍 开发板没有HDMI编码芯片,是将FPGA的3.3差分IO直接连接到HDMI连接器,FPGA 完成 24 位 RGB 编码输出TMDS 差分信号。 HDMI传输要素: TMDS 差分信号 TMDS&#xff08…

江协科技STM32学习- P35 硬件I2C读写MPU6050

🚀write in front🚀 🔎大家好,我是黄桃罐头,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流 🎁欢迎各位→点赞👍 收藏⭐️ 留言📝​…

39页PDF | 华为数据架构建设交流材料(限免下载)

一、前言 这份报告是关于企业数据架构建设的交流材料,详细介绍了数据架构在企业架构中的重要性,阐述了数据架构的定义、包含的四个核心组件(数据资产目录、数据标准、数据模型和数据分布),并通过交通和城市政务服务的…

三周精通FastAPI:27 使用使用SQLModel操作SQL (关系型) 数据库

官网文档:https://fastapi.tiangolo.com/zh/tutorial/sql-databases/ SQL (关系型) 数据库 FastAPI不需要你使用SQL(关系型)数据库。 但是您可以使用任何您想要的关系型数据库。 这里我们将看到一个使用SQLModel的示例。 SQLModel是在SQLAlchemy和Pydantic的基础…