【深度学习】第一门课神经网络和深度学习 Week 3 浅层神经网络

【深度学习】第一门课神经网络和深度学习 Week 3 浅层神经网络

news/2024/9/22 7:40:30/文章来源:https://blog.csdn.net/Summerison/article/details/138415355

🚀Write In Front🚀
📝个人主页：令夏二十三
🎁欢迎各位→点赞👍 + 收藏⭐️ + 留言📝
📣系列专栏：深度学习
💬总结：希望你看完之后，能对你有所帮助，不足请指正！共同学习交流 🖊

文章目录

3.1 神经网络概述

3.2 神经网络的表示

3.3 计算一个神经网络的输出

3.3.1 神经网络的符号惯例

3.3.2 神经网络的计算

3.4 多样本向量化

3.5 向量化实现的解释

3.6 激活函数

3.11 随机初始化

3.1 神经网络概述

本周的学习目标是实现一个神经网络，现在我们预览一下这周将要学习的内容。

上面讲了逻辑回归模型，也就是多个输入进入一个模型中，得到一个输出，由于模型中包含Sigmoid函数，因此输出为 0 或 1 。

这样的一个模型在神经网络中只是一个节点：

注意， [ i ] 表示第 i 层，( i ) 表示第 i 个训练样本，不能搞混了。

一个神经网络会包含很多层，其实道理跟最简单的逻辑回归模型是一样的，都是从左到右做前向传播，由特征值得到最终结果预测值，训练的话，从右往左依次求导，就可以对参数进行更新。

3.2 神经网络的表示

输入层：图中最左侧的输入特征 x1、x2、x3 组成的一层称为输入层，也就是这个神经网络的输入。
隐藏层：在神经网络的训练中，我们用到的训练集只包含输入层和输出层的数据，而神经网络中的的数据是看不到的，但是它们又确实存在，于是称之为隐藏层。
输出层：在图中，这个神经网络只有一个 y^ 作为输出，它是由一个节点输出的，这个节点就是这个神经网络的输出层。

神经网络中，每一个输入都可以使用带上角标 [ i ] 的 a 来表示，由于上一层的节点被激活后才会有输出，于是这里的 a 表示下一层节点输入的激活值（Active Value）。

在这个示例里，输出层的每个输入特征都可以写成 a ，表示输入层的激活值，其上角标都为 [ 0 ]；

在隐藏层，我们可以看到有四个节点，于是就会有四个激活值从节点输出，并输入到下一层，这里的激活值 a 的上角标都为 [ 1 ] ，在代码中，我们把这一层的激活值集合到一个列向量里，如图所示：

最后的输出层产生的数值，也就是 y^，我们将其取值为上角标为 [ 2 ] 的激活值 a。

在深度学习领域，神经网络的层数是不包含输入层的，于是我们把这个示例称为一个两层的神经网络。

3.3 计算一个神经网络的输出

3.3.1 神经网络的符号惯例

x ：输入特征
a ：每个神经元的输出
W ：特征的权重
上标 [ i ] ：神经网络的第 i 层
下标 i ：该层神经网络的第 i 个神经元

3.3.2 神经网络的计算

其实就跟之前提到的逻辑回归是一样的，首先计算 z，再套用 Sigmoid 函数计算出 a，一个神经网络只是这样做了好多次重复计算。

回到前面的示例，我们有了输入后，就可以计算隐藏层的激活值：

在代码中，我们可以利用矩阵运算（向量化）来缩短计算时间：

总而言之，在这里我们只要做下面这四个计算：

通过这些公式，我们可以根据给出的一个单独的输入特征向量计算出一个简单神经网络的输出。

3.4 多样本向量化

神经网络训练中涉及到很多输入样本，我们需要把这些输入样本集成到一个矩阵中，这样就可以实现更加方便的计算，通过矩阵运算可以同时对所有样本进行预测值的求解，矩阵如下：

从水平上看，矩阵代表了 m 个训练样本，从竖直上看，矩阵的不同 [ i ] 索引对应了不同的隐藏单元。

3.5 向量化实现的解释

使用上面的方法得到矩阵和向量后就可以使用先前的公式进行 z 的计算了：

矩阵乘以列向量，最终得到的是列向量，再通过向量和常数的加法，加上 b，也就得到了最终的 z。

3.6 激活函数

训练一个神经网络时，需要决定使用哪种激活函数用在隐藏层上，哪种用在输出层上。激活函数有很多，上面只提到了 Sigmoid 函数，但其实还有其他的，有时候用起来更好。

选择激活函数的经验：

对于二分类问题，输出层选择 Sigmoid 函数，然后其他的所有单元都选择 Relu 函数；
如果在隐藏层上不确定使用哪个激活函数，那就用 Relu 函数。

要注意的区别：

在实践中，使用 Relu 函数激活的神经网络通常比用 sigmoid 或 tanh 函数激活的学习地更快；
sigmoid 函数和 tanh 函数在正负饱和区的梯度都接近于0，这会造成梯度弥散，而 Relu 函数和 Leaky Relu 函数大于0部分都为常数，不会产生梯度弥散现象。

3.11 随机初始化

我们在训练神经网络的时候，权重随机初始化是很重要的，因为如果所有节点输出的权重值一样的话，同一层下的所有节点将会是一模一样的，那样设置这些节点就没有意义。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.xdnf.cn/news/1410924.html

如若内容造成侵权/违法违规/事实不符，请联系一条长河网进行投诉反馈，一经查实，立即删除！

相关文章

Kelpa-小型服务器开发框架分享

Kelpa-小型服务器开发框架分享

分享我的服务器开发框架--Kelpa： 这是一个由现代C编写的小型、学习性质的服务器框架，包含压缩，序列化，IO调度，Socket封装，文件配置，日志库等多个完整自研模块： 项目目前仍处于开发阶…

阅读更多...

QT：输入类控件的使用

QT：输入类控件的使用

LineEdit 录入个人信息 #include "widget.h" #include "ui_widget.h" #include <QDebug> #include <QString>Widget::Widget(QWidget *parent): QWidget(parent), ui(new Ui::Widget) {ui->setupUi(this);// 初始化输入框ui->lineEdit…

阅读更多...

文本嵌入的隐私风险：从嵌入向量重建原始文本的探索

文本嵌入的隐私风险：从嵌入向量重建原始文本的探索

随着大型语言模型（LLMs）的广泛应用，文本嵌入技术在语义相似性编码、搜索、聚类和分类等方面发挥着重要作用。然而，文本嵌入所蕴含的隐私风险尚未得到充分探讨。研究提出了一种控制生成的方法，通过迭代修正和重新嵌入文…

阅读更多...

嵌入式硬件中PCB走线与过孔的电流承载能力分析

嵌入式硬件中PCB走线与过孔的电流承载能力分析

简介使用FR4敷铜板PCBA上各个器件之间的电气连接是通过其各层敷着的铜箔走线和过孔来实现的。由于不同产品、不同模块电流大小不同，为实现各个功能，设计人员需要知道所设计的走线和过孔能否承载相应的电流，以实现产品的功能，防止过流时产品烧毁。文中介绍设计和测试FR4敷…

阅读更多...

【探索】文字游侠AI新时代，每天5分钟自动化创作图文月入1万+，十分适合新手小白，附上渠道和教程（全面）

【探索】文字游侠AI新时代，每天5分钟自动化创作图文月入1万+，十分适合新手小白，附上渠道和教程（全面）

在这个信息爆炸的时代，内容创作者面临着空前的竞争。为了在今日头条这样的平台上脱颖而出并获取稳定收入，他们需要找到更高效、更创新的方法。而今，一款全新的AI工具正引领着一场革命，彻底改变了内容创作的生态。自从GPT问世以来…

阅读更多...

Quad SPI的DLP优化原理

Quad SPI的DLP优化原理

1 前言 1.1 Quad SPI Flash QSPI的I/O接口如图1所示，其中： ① CS：片选信号，低电平有效（FLASH被选中）； ② CK：时钟信号，由主设备产生； ③ SI/SO： …

阅读更多...

开源的 RAG 和 workflow 技术对比调研

开源的 RAG 和 workflow 技术对比调研

一、先来了解一下开源的技术有哪些，怎么样我自己就是做RAG工作的，但是还是想关注一下开源的技术做到了什么程度。所以调研了很长时间，也体验了一下。这里写一篇文章来分享一下结果。我用五一的假期时间，来做调研，看…

阅读更多...

扩展学习|本体研究进展

扩展学习|本体研究进展

文献来源： 王向前,张宝隆,李慧宗.本体研究综述[J].情报杂志,2016,35(06):163-170. 一、本体的定义本体概念被引入人工智能、知识工程等领域后被赋予了新的含义。然而不同的专家学者对本体的理解不同,所给出的定义也有所差异。人工智能领域的学者Neches(1991)等人对…

阅读更多...

常用AI工具分享 + IDEA内使用通义灵码

常用AI工具分享 + IDEA内使用通义灵码

引言随着人工智能技术的飞速发展，AI工具已经渗透到我们日常生活和工作的各个领域，带来了前所未有的便利。现在我将分享一下常用的AI工具，以及介绍如何在IDEA中使用通义灵码。常用AI工具 1. 通义灵码 (TONGYI Lingma) - 由阿里云开发的智能…

阅读更多...

时间复杂度空间复杂度力扣：转轮数组，消失的数字

时间复杂度空间复杂度力扣：转轮数组，消失的数字

1. 算法效率如何衡量一个算法的好坏？一般是从时间和空间的维度来讨论复杂度，但是现在由于计算机行业发展迅速，所以现在并不怎么在乎空间复杂度了下面例子中，斐波那契看上去很简洁，但是复杂度未必如此 long long Fib…

阅读更多...

Java -- (part20)

Java -- (part20)

一.Map集合 1.概述双列集合的顶级接口 2.实现类 HashMap 特点: a.key唯一,value可重复->如果key重复了,会发生value覆盖 b.无序 c.无索引 d.线程不安全 e.可以存null键null值数据结构: 哈希表方法: LinkedHashMap 特点: a.key唯一,value可重复->如果ke…

阅读更多...

PHP医院安全（不良）事件报告系统源码 vue2+element支持11大类不良事件上报、审核处理、分析改进

PHP医院安全（不良）事件报告系统源码 vue2+element支持11大类不良事件上报、审核处理、分析改进

PHP医院安全（不良）事件报告系统源码 vue2element支持11大类不良事件上报、审核处理、分析改进医院安全（不良）事件管理系统采用无责的、自愿的填报不良事件方式，有效地减轻医护人员的思想压力，实现以事件为…

阅读更多...

深度学习500问——Chapter08：目标检测（6）

深度学习500问——Chapter08：目标检测（6）

文章目录 8.3.7 RetinaNet 8.3.7 RetinaNet 研究背景 Two-Stage 检测器（如Faster R-CNN、FPN）效果好，但速度相对慢。One-Stage 检测器（如YOLO、SSD）速度快，但效果一般。作者对one-stage检测器准确率不高…

阅读更多...

QT：label标签的使用

QT：label标签的使用

文章目录设置不同格式的文本显示图片文本对齐/自动换行/缩进/边距设置不同格式的文本在文本格式中，存在富文本，makedown格式的文本，还有纯文本，下面就依据这三个进行举例 #include "widget.h" #include "ui_w…

阅读更多...

缩小COCO数据集

缩小COCO数据集

在运行YOLOS模型的过程中，需要使用到COCO2017这个数据集，但从实验运行来看，其所需时间无疑是相当漫长，预计可能需要近几十天才能完成，因此便考虑缩小COCO数据集大小，即尽可能在遵循其分布的情况下&#xff…

阅读更多...

导游讲解口才技巧心得体会总结（3篇）

导游讲解口才技巧心得体会总结（3篇） **篇：提升表达力，传递独特魅力在导游工作中，口才技巧的重要性不言而喻。通过不断的实践和反思，我深刻体会到提升表达力对于导游工作的重要性。一个清晰、生动、有趣的…

阅读更多...

【c++】继承学习(一)：继承机制与基类派生类转换

【c++】继承学习(一)：继承机制与基类派生类转换

🔥个人主页：Quitecoder 🔥专栏：c笔记仓朋友们大家好，本篇文章我们来学习继承部分目录 1.继承的概念和定义继承的定义继承基类成员的访问方式变化 2.基类和派生类对象赋值转换3.继承中的作用域 1.继承的概念和定义 …

阅读更多...

OSPF实验系列---3.综合实验

OSPF实验系列---3.综合实验

OSPF的综合实验实验拓扑及要求如下实验分析 1.R4为ISP，进行IP配置，区域0为公网区域，配置IP地址 2.做MGRE，R3为中心站点，形成Hub-Spoke 3.子网划分 4.私网互通，NAT转换 5.做特殊区域，修改hel…

阅读更多...

【C++】STL简介

【C++】STL简介

🔥个人主页： Forcible Bug Maker 🔥专栏： C 目录前言什么是STL？STL的历史STL的版本STL六大组件STL的优缺点STL的优点：STL的缺点： 如何学习STL结语前言本篇博客主要内容：STL简介。…

阅读更多...

01.本地工作目录、暂存区、本地仓库三者的工作关系

01.本地工作目录、暂存区、本地仓库三者的工作关系

1.持续集成 1.持续集成CI 让产品可以快速迭代，同时还能保持高质量。简化工作 2.持续交付交付 3.持续部署部署 4.持续集成实现的思路 gitjenkins 5.版本控制系统 1.版本控制系统概述2.Git基本概述3.Git基本命令 2.本地工作目录、暂存区、本地仓库三者的工作关系…

阅读更多...

最新文章