【深度学习】(1)--神经网络

文章目录

  • 深度学习
  • 神经网络
    • 1. 感知器
    • 2. 多层感知器
      • 偏置
    • 3. 神经网络的构造
    • 4. 模型训练
      • 损失函数
  • 总结

深度学习

深度学习(DL, Deep Learning)是机器学习(ML, Machine Learning)领域中一个新的研究方向。

在这里插入图片描述

从上方的内容包含结果,我们可以知道,在学习深度学习之前,我们还需要了解一下什么是神经网络。

神经网络

神经网络,我们可以将它类比为人类的神经元,由外界传递信息,产生神经冲动,传递电信号,做出行为的过程。

在这里插入图片描述

这是生物学上的体现,那么,在神经网络中是如何体现的呢?
在这里插入图片描述

由外界传入数据,然后通过“路径”抵达神经元,在每一条的“路径”上会有不同的w参数,与传入的数据进行计算。从而影响接收值:

在这里插入图片描述

在推导式中,每条“路径”上的信息传入神经元,然后对他们进行累加求和,接着经过特定的输出函数sigmoid函数输入,对结果进行分类。

神经网络的本质:通过参数与激活函数来拟合特征与目标之间的真实函数关系。但在一个神经网络的程序中,不需要神经元和线,本质上是矩阵的运算,实现一个神经网络最需要的是线性代数库。

1. 感知器

由两层神经元组成的神经网络–“感知器”(Perceptron),感知器只能线性划分数据。

在这里插入图片描述

对于这样简单的感知器,只能线性划分数据,因为对于神经元的结果,只有y =kx+b一层计算,只可以在二维空间画一条直线划分,这样的话,对于一些区域型的数据无法具体分类,比如:

在这里插入图片描述

对于这组数据的分类,是无法通过一条直线就让它们分开的,那该如何分类N呢?

我们得让分类的线弯曲,比如:

在这里插入图片描述

这样就将类别划分开了。可是,我们该怎样使这条“线”弯曲呢?通过多层感知器。

2. 多层感知器

多层感知器其实就是增加了一个中间层,即隐含层。而这,也就是神经网络可以做非线性分类的关键。

在这里插入图片描述

多层感知器同简单感知器的区别就是多加了1层运算,那这样我们的计算就变成了y=w1x1+w2x2+b,在一个二维图片中,这样的函数计算可以使“线”弯曲,从而实现了非线性分类。

偏置

在神经网络中需要默认增加偏置神经元(节点),这些节点是默认存在的。它本质上是一个只含有存储功能,且存储值永远为1的单元。在神经网络的每个层次中,除了输出层以外,都会含有这样一个偏置单元。

在这里插入图片描述

偏置节点没有输入(前一层中没有箭头指向它)。一般情况下,我们都不会明确画出偏置节点。

3. 神经网络的构造

在这里插入图片描述

神经网络从左到右分为输入层、隐含层、输出层。

需要记忆

  1. 设计一个神经网络时,输入层与输出层的节点数往往是固定的,中间层则可以自由指定
    1. 输入层的节点数:与特征的维度匹配(特征数量)。
    2. 输出层的节点数:与目标的维度匹配(类别结果数量)。
    3. 中间层的节点数:目前业界没有完善的理论来指导这个决策。一般是根据经验来设置。
  2. 神经网络结构图中的拓扑与箭头代表着预测过程时数据的流向,跟训练时的数据流有一定的区别;
  3. 结构图里的关键不是圆圈(代表“神经元”),而是连接线(代表“神经元”之间的连接)。每个连接线对应一个不同的权重(其值称为权值),这是需要训练得到的。

4. 模型训练

模型训练的目的:使得参数尽可能的与真实的模型逼近。

具体做法:

  1. 首先给所有参数赋上随机值。我们使用这些随机生成的参数值,来预测训练数据中的样本。
  2. 计算预测值为yp,真实值为y。那么,定义一个损失值loss,损失值用于判断预测的结果和真实值的误差,误差越小越好。

损失函数

  1. 均方差损失函数

对真实值与预测值作差然后做平方,计算每一条数据的差值平方加起来,然后再除以数据的条数即可得到损失值。

在这里插入图片描述

  1. 多分类的情况下,交叉熵损失函数

运算过程,将一组数据传入:

在这里插入图片描述

公式:

在这里插入图片描述

总结

本篇介绍了:

  1. 神经网络的构造
  2. 神经网络的运行过程
  3. 感知器

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/144379.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

量化交易软件QMT推荐吗?QMT如何设定函数?

QMT系统函数的设定涉及多个方面,主要是基于策略的需求来配置的。以下是从初始化配置到交易策略函数编写的关键步骤和方法,以及对常见函数的介绍和设置: 初始化函数和配置(Init 函数) Init 函数的角色: 初始…

【算法】堆与优先级队列

【ps】本篇有 4 道 leetcode OJ。 目录 一、算法简介 二、相关例题 1)最后一块石头的重量 .1- 题目解析 .2- 代码编写 2)数据流中的第 K 大元素 .1- 题目解析 .2- 代码编写 3)前K个高频单词 .1- 题目解析 .2- 代码编写 4&#xf…

怎么操作使http变成https访问?

获取SSL证书 选择证书颁发机构:可以选择受信任的免费或付费证书颁发机构(CA)如JoySSL 申请和验证域名:注册并填写注册码230920,验证域名所有权。下载SSL证书文件到本地电脑. JoySSL品牌证书 注册享大额优惠JoySSL是网…

数据结构——二叉树堆的专题

1.堆的概念及结构 如果有一个关键码的集合K {K0 &#xff0c;K1 &#xff0c;K2 &#xff0c;K3…&#xff0c;K(N-1) }&#xff0c;把它的所有元素按完全二叉树的顺序存储方式存储 在一个一维数组中&#xff0c;并满足&#xff1a;Ki < K2*i1且 Ki<K2*i2 ) i 0&#…

MICROLAB电源维修MXP7U 400-60 高压电源维修

法国MICROLAB POWER SUPPLY全系列型号电源维修MXP 1500-10。 专注维修进口设备电源&#xff0c;主要有高压电源&#xff08;High Power Supply&#xff09;、框架式可控大功率直流电源&#xff08;DC Power Supply&#xff09;、射频电源(RF Generator)、微波发生器(Microwave…

制作京东首页右侧固定层

html部分 <!DOCTYPE html> <html> <head lang"en"><meta charset"UTF-8"><title>京东首页右侧固定层</title><link href"css/nav.css" rel"stylesheet"> </head> <body> <…

猎板PCB:精密多层板压合定制工艺,打造高性能电路板解决方案

在多层板PCB的制造过程中&#xff0c;压合定制工艺是确保电路板性能和可靠性的关键环节。以下是对猎板PCB多层板压合定制工艺的详细介绍和优化&#xff1a; 选材与预处理&#xff1a; 精选高品质基材&#xff0c;如FR-4&#xff0c;确保机械和电气性能。对铜箔进行彻底清洁、微…

解决猫咪缺水难题!主食罐应该多久喂一次?补水主食罐推荐

我们家猫咪以猫粮为主食&#xff0c;但每周至少要喂2——3个主食猫罐头。这是因为猫粮的水含量低&#xff0c;加上猫咪习惯从猎物中获取所水分&#xff0c;很少主动喝水&#xff0c;只喂猫粮的话&#xff0c;猫咪容易因为补水不足而患上泌尿系统疾病、肾脏等问题。而主食罐头的…

【经典文献】双边曲面去噪

文章目录 2003 TOG基本思想效果 2003 TOG 2003年&#xff0c;Fleishman等人在TOG上&#xff0c;基于图像双边滤波的思想&#xff0c;将其改造成了可以用在曲面上的双边滤波算法。 Fleishman S, Drori I, Cohen-Or D. Bilateral mesh denoising[M]//ACM SIGGRAPH 2003 Papers.…

YOLOv9改进策略【卷积层】| AKConv: 具有任意采样形状和任意参数数量的卷积核

一、本文介绍 本文记录的是利用AKConv优化YOLOv9的目标检测网络模型。标准卷积操作的卷积运算局限于局部窗口&#xff0c;无法捕获其他位置的信息&#xff0c;且采样形状固定&#xff0c;无法适应不同数据集和位置中目标形状的变化。而AKConv旨在为卷积核提供任意数量的参数和…

LeetCode[中等] 438. 找到字符串中所有字母异位词

给定两个字符串 s 和 p&#xff0c;找到 s 中所有 p 的 异位词 的子串&#xff0c;返回这些子串的起始索引。不考虑答案输出的顺序。 异位词 指由相同字母重排列形成的字符串&#xff08;包括相同的字符串&#xff09;。 思路&#xff1a;滑动窗口 s包含p的异位词 ——> 则…

静态住宅代理 vs 住宅代理:稳定IP有哪些优势?

在代理服务器中&#xff0c;我们通常以IP地址是否经常轮换为标准&#xff0c;将代理分为静态和住宅代理。这两种代理方式各有千秋&#xff0c;在不同的应用场景中发挥着不同的作用。但是由于场景繁多&#xff0c;用处也大有不同&#xff0c;导致很多人对于这两种代理方式并不是…

基于微信小程序的游泳馆管理系统--论文源码调试讲解

2 关键技术介绍 2.1 SSM框架 开发信息管理系统的主流框架是SSM&#xff08;Spring Spring MVC MyBatis&#xff09;&#xff0c;SSM框架web层使用Spring MVC框架&#xff0c;使传输前后端数据变得简单&#xff1b;对于业务层使用Spring作为轻量级控制反转和面向切面的容器框…

C++速通LeetCode中等第5题-无重复字符的最长字串

字串substr法&#xff0c;定义字串的头部和长度&#xff0c;和字串后一位对比&#xff0c;如果不存在重复元素则长度1&#xff0c;存在重复元素则头部更新&#xff0c;长度重置。 class Solution { public:int lengthOfLongestSubstring(string s) {string s2;//存放s的前一部分…

springboot实训学习笔记(4)(Spring Validation参数校验框架、全局异常处理器)

接着上篇博客学习。上篇博客是已经基本完成用户模块的注册接口的开发。springboot实战学习笔记&#xff08;3&#xff09;(Lombok插件、postman测试工具、MD5加密算法、post请求、接口文档、注解、如何在IDEA中设置层级显示包结构、显示接口中的方法)-CSDN博客本篇博客主要是关…

【free -h内存占用】

在 free -g 命令的输出中&#xff0c;最能准确反映系统中剩余可用内存的参数是 available。这个参数考虑了缓存和缓冲的内存&#xff0c;可以更准确地反映系统的可用内存。 让我们再看一下假设的输出&#xff1a; total used free shared buff/cache av…

【PGCCC】使用 Postgres 进行数据分析的窗口函数

SQL 在处理单行数据时&#xff0c;甚至在聚合多行数据时都很有意义。但是&#xff0c;当您想比较已计算的行之间的数据时会发生什么&#xff1f;或者创建数据组并进行查询&#xff1f;输入窗口函数。 窗口函数往往会让人感到困惑 - 但它们是 SQL 中用于数据分析的非常棒的工具…

实验2 Linux文件系统常用操作实践

实验2 Linux文件系统常用操作实践 一、实验介绍 本节实验通过实战Linux文件操作模块的基本操作,需要先掌握linux文件系统的原理以及理解linux文件操作的原理,最后通过实操完成linux文件操作的命令,其中包括改变目录、创建目录及文件、删除文件、复制文件、文件移动和改名、查…

【大模型入门】零基础入门AI大模型应用开发,你需要一个系统的入门路径!

随着大模型技术的飞速发展&#xff0c;我们正站在一个全新的技术前沿&#xff0c;探索着如何将这些强大的工具应用于实际问题的解决。如果你对AI大模型应用开发充满热情&#xff0c;那么你可以读一下这篇文章——一个系统全面的入门指南&#xff0c;专为渴望深入AI世界的你设计…

Windows 系统管理

1 安装 Windows Server 2016 操作系统的硬件最低需求&#xff1f; 处理器 1.4GHz 64 位处理器 RAM 512MB&#xff08;带桌面体验 2GB&#xff09; 磁盘空间 32GB 2 Windows Server 2016 操作系统的常见版本&#xff1f; Windows Server 2016 Standard&#xff08; 标 准 版 &a…