【深度学习发展史】张量与神经网络|生成模型|序列学习模型|深度强化学习是如何一步步发展的?

【深度学习发展史】张量与神经网络|生成模型|序列学习模型|深度强化学习是如何一步步发展的?

【深度学习发展史】张量与神经网络|生成模型|序列学习模型|深度强化学习是如何一步步发展的?


文章目录

  • 【深度学习发展史】张量与神经网络|生成模型|序列学习模型|深度强化学习是如何一步步发展的?
  • 前言
  • 1.张量与神经网络的起源
  • 2.生成模型的发展
  • 3.序列学习的发展
  • 4.深度强化学习的发展
  • 总结


前言

深度学习作为人工智能的一个分支,经历了数十年的发展,形成了如今广泛应用的体系。以下内容将从四个关键方面详细介绍深度学习的发展历程,并结合一些里程碑式的研究与成果加以说明。

深度学习的发展史主要参考唐杰老师的学生整理的一个博文,并结合自己的理解补充。欢迎大家批评指正!
参考链接:
https://weibo.com/2126427211/GavUQjfLa?type=comment#_rnd1543322198481


1.张量与神经网络的起源

  • 1958年,Frank Rosenblatt 提出了感知器(Perceptron),这是最早的神经网络模型之一,能够实现二元分类任务。然而,由于当时的计算能力不足感知器在处理复杂任务时表现受限,尤其在多层神经网络的训练上出现瓶颈,导致这类网络的发展陷入停滞。

  • 1979年,Kunihiko Fukushima 提出了Neocognitron,它被认为是卷积神经网络(CNN)的雏形。这一模型引入了卷积和池化的概念,用于提取图像中的局部特征,对后来的图像识别有重要影响

  • 1986年,Geoffrey Hinton 提出了反向传播算法(Backpropagation),这是神经网络训练的一次革命性突破。Hinton的工作使得多层神经网络(即多层感知器,MLP)可以通过梯度下降进行有效训练,推动了深度学习的发展。反向传播算法成为深度学习的核心基础之一,直到今天仍在广泛使用。

  • 1998年,Yann LeCun 提出了LeNet-5,这是一个7层的卷积神经网络,用于手写数字识别(MNIST 数据集)。LeNet-5 的提出标志着卷积神经网络(CNN)开始进入实用阶段,成为处理图像数据的主要工具之一。

  • 2012年AlexNet 在 ImageNet 大赛上取得突破,显著提升了图像识别的准确性。AlexNet 的成功归功于使用了更深的网络结构、ReLU 激活函数和 Dropout 正则化技术,以及当时强大的 GPU 算力。AlexNet 的成功使得深度学习在计算机视觉领域的应用广泛普及。

  • 2015年,Google 的团队提出了 GoogLeNet 和 Inception 模型,进一步优化了网络的深度和计算效率

  • 2016年,华人学者何恺明提出了ResNet(残差网络),通过引入残差结构,成功解决了深层网络中的梯度消失问题,推动了超深神经网络的发展。ResNet 也是卷积神经网络在各类竞赛和应用中广泛使用的重要模型。

  • 2017年,何恺明的团队又提出了DenseNet这种网络通过密集连接将每一层的输出直接传递到所有后续层,进一步提高了网络的学习效率和特征复用能力

2.生成模型的发展

  • 20世纪80年代,Hinton 提出了受限玻尔兹曼机(RBM),用于无监督学习。2006年,RBM 被叠加成深度信念网络(DBN),这标志着叠加网络的一个重要开端。DBN 可以逐层训练,解决了深层网络训练中的梯度消失问题

  • 1980年代,Autoencoder(自编码器) 作为一种无监督学习方法被提出。Autoencoder 用于降维和特征提取,后来被广泛应用于生成模型

  • 2008年,Yoshua Bengio 提出了去噪自编码器(Denoising Autoencoder),在自编码器的基础上增强了网络的鲁棒性

  • 2013年,Kingma 和 Welling 提出了变分自编码器(VAE),这是一种生成模型,能够对数据进行概率建模

  • 2014年,Ian Goodfellow 和 Bengio 等提出了生成对抗网络(GAN),这是生成模型的一个革命性发展。GAN 由生成器和判别器组成,通过博弈论的方式训练,能够生成逼真的数据。GAN 的提出极大地推动了生成模型的研究,使得该领域迅速成为热门。随后,出现了许多 GAN 的变种模型,包括DCGAN、CGAN、WGAN 等。

3.序列学习的发展

  • 1982年Hopfield 网络被提出,用于处理时间序列数据。这是序列学习的早期模型。

  • 1997年,Sepp Hochreiter 和 Jürgen Schmidhuber 提出了长短期记忆网络(LSTM)LSTM 能够有效地捕捉序列中的长期依赖,解决了传统 RNN 中梯度消失的问题。LSTM 广泛应用于语音识别、机器翻译等序列任务。

  • 2013年,Hinton 的团队将RNN 和 LSTM 应用于语音识别,取得了显著的突破,极大地推动了序列学习的发展。

  • 2003年语言模型(LM)开始逐步成熟,2013年,Mikolov 提出了Word2Vec,引入了词向量的概念,为自然语言处理领域的研究奠定了基础。

  • 随后,Glove、FastText 等词向量模型相继出现,并不断提升 NLP 任务的表现。

  • 2018年基于Transformer架构的预训练模型BERT横空出世,成为 NLP 领域的重要突破。BERT 能够在多个 NLP 任务中取得最佳效果,并改变了 NLP 的主流方法。

4.深度强化学习的发展

  • 2013年,Google 的 DeepMind 团队提出了Deep Q-Learning(深度 Q 学习),将深度学习引入强化学习,取得了良好的表现。该方法在 Atari 游戏中展现了极高的智能水平,成为深度强化学习的里程碑。

  • 2015年,Double DQN 提出,进一步提高了 Q-learning 的稳定性

  • 2016年,DeepMind 提出了AlphaGo,通过结合深度学习和蒙特卡洛树搜索,成功击败了人类围棋冠军。AlphaGo 的成功极大地提升了公众对 AI 的关注度,并推动了深度强化学习的快速发展。

  • 2017年,AlphaGo Zero 推出,这一版本的 AlphaGo 不再依赖人类数据,通过自我对弈进行训练,展现了 AI 自我学习的潜力

总结

深度学习从最早的神经网络模型逐步演化为今天的多层网络、生成模型、序列学习和强化学习系统

在过去的几十年中,得益于反向传播算法、卷积神经网络、生成对抗网络、LSTM 和 AlphaGo 等一系列突破性成果,深度学习已被广泛应用于图像识别、自然语言处理、游戏智能体、医疗诊断等众多领域。

未来,随着计算资源的不断提升和算法的持续优化,深度学习将继续在更多领域展现其巨大的潜力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1544063.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

【学术会议征稿】第七届电力电子与控制工程国际学术会议(ICPECE 2024)

高录用|快检索|JPCS独立出版ISSN:1742-6596 连续6年EI检索,稳定且快速 见刊后均1个月检索 第七届电力电子与控制工程国际学术会议(ICPECE 2024) 2024 7th International Conference on Power Electronics and Control Engineering 2024年…

认知作战壳吉桔:未来认知战战略全案发展趋势

认知作战壳吉桔:未来认知战战略全案发展趋势 认知作战壳吉桔:未来认知战战略全案发展趋势 关键词:认知战战术融合, 数据驱动决策, 生成式人工智能AIGC, 影响力认知, 个性化定制, 沉浸式体验, 视频直播认知, 受众体验优化, 社交媒体互动, 可…

[PICO VR]Unity如何往PICO VR眼镜里写持久化数据txt/json文本

前言 最近在用PICO VR做用户实验,需要将用户实验的数据记录到PICO头盔的存储空间里,记录一下整个过程 流程 1.开启写入权限 首先开启写入权限:Unity->Edit->Player->安卓小机器人->Other Settings->Configuration->Wri…

如何用LightningChart Python实现地震强度数据可视化应用程序?

LightningChart Python是知名图表控件公司LightningChart Ltd正在研发的 Python 图表,目前还未正式推出,感兴趣的朋友可以戳文末链接申请试用! 什么是地面震动强度 Python 应用程序? 地面震动是地震的基本特征,会对建…

【Linux】fork入门级使用

目录 一、前置准备 1、进程的基本概念 2、进程标识符PID、PPID 1)pid介绍 2)获取pid和ppid 二、fork函数 1、fork的基本介绍 1)fork(): 创建子进程 2)对于函数具体的描述 3&#xff09…

yuque-dl-语雀知识库下载为本地markdown

之前有下载语雀的需求&#xff0c;发现了一个开源项目&#xff0c;用起来还是很顺手的 需要环境 需要前端的node环境 https://nodejs.cn/ Node.js 18.4 or later 插入 npm i -g yuque-dl 使用 $ yuque-dl --helpUsage:$ yuque-dl <url>Commands:<url> …

Python 如何读取和写入文件

Python 如何读取和写入文件 文件操作是编程中常见的任务&#xff0c;几乎所有编程语言都支持文件的读写功能。在 Python 中&#xff0c;文件操作简单直观&#xff0c;适用于从初学者到经验丰富的开发者。无论是处理小型文本文件&#xff0c;还是需要处理大型数据文件&#xff…

fo-dicom是如何实现DICOM 的网络通信功能

一、前言 前面的文章&#xff0c;我们介绍了fo-dicom是一个怎样的开源库等一些内容&#xff1a; fo-dicom&#xff0c;第一个基于.NET Standard 2.0 开发的DICOM开源库fo-dicom开源库是如何满足 DICOM标准的基本要求fo-dicom开发之DICOM数据解析&#xff1a;常见数据类型及处…

【Transformers基础入门篇2】基础组件之Pipeline

文章目录 一、什么是Pipeline二、查看PipeLine支持的任务类型三、Pipeline的创建和使用3.1 根据任务类型&#xff0c;直接创建Pipeline&#xff0c;默认是英文模型3.2 指定任务类型&#xff0c;再指定模型&#xff0c;创建基于指定模型的Pipeline3.3 预先加载模型&#xff0c;再…

pycharm恢复两边侧边栏常驻显示

问题&#xff1a; pycharm两边的侧边栏菜单默认不显示&#xff08;打开project还得用alt1快捷键&#xff09;&#xff0c;非常不方便&#xff0c;如下图&#xff1a; pycharm版本&#xff1a;2022.3 professional 勾选&#xff1a;setttngs -> Appearance -> tool Wind…

云原生虚拟化kubevirt安装

kubevirt 介绍 Kubevirt 是 Redhat 开源的一套以容器方式运行虚拟机的项目&#xff0c;通过 kubernetes 云原生方式来管理虚拟机生命周期。它通过使用自定义资源&#xff08;CRD&#xff09;和其它 Kubernetes 功能来无缝扩展现有的集群&#xff0c;以提供一组可用于管理虚拟机…

JavaScript的注释与常见输出方式

注释 源码中注释是不被引擎所解释的&#xff0c;它的作用是对代码进行解释。Javascript 提供两种注释的写法:一种是单行注释&#xff0c;用//起头;另一种是多行注释&#xff0c;放在/*和*/之间。 单行注释&#xff1a; //这是单行注释 多行注释&#xff1a; /*这是 多行 注…

远程升级,你成功了吗?

最近又遇到了远程升级失败的情况&#xff0c;而且是不明原因的多次接连失败。。。 事情是这样的&#xff1a;最近有客户反馈在乡村里频繁出现掉线的情况。通过换货、换SIM卡对比排查测试&#xff0c;发现只有去年5月22号采购的那批模块在客户环境附近会出现掉线的情况&#xf…

服务器操作系统【sar 命令】

sar 安装、语法参数说明以及示例 文章目录 功能概述一、功能介绍1.安装配置2. 配置3. 启动二、sar 语法及参数说明三、示例及释义1.汇报 io 传输速率信息2.内存分页信息3.块设备状态信息4.hugepages 利用率统计信息5.列长度和负载平均值6.内存利用率统计信息7.swap 交换空间利用…

Redis数据持久化总结笔记

Redis 是内存数据库&#xff0c;如果不将内存中的数据库状态保存到磁盘&#xff0c;那么一旦服务器进程退出&#xff0c;服务器中的数据库状态也会消失。所以 Redis 提供了持久化功能&#xff01; Redis 提供了 2 个不同形式的持久化方式 RDB&#xff08;Redis DataBase&#…

VS2019配置Open3Dv0.18.0版本库

文章目录 一、引言二、配置过程三、举个例子参考资料一、引言 现在如果直接使用vs2019对Open3D(v0.15.2)进行编译,会比较麻烦,一是需要科学上网,另一个就是容易出现错误,这里就仍然按照之前的思路来配置新版本的Open3D(VS2015(及以上版本)配置Open3Dv0.15.2版本库)。 二…

科研小白入门工具

三、科研绘图 1.流程图绘制工具&#xff1a;powerpoint、亿图图示、visio、draw.io 2.绘制标准&#xff1a;布局合理、色彩鲜明、字体大小、矢量输出 矢量图绘制推荐流程&#xff1a;亿图图示绘制--visio--word--pdf无损放大 3.文章插图&#xff1a;excel、origin、matlab、…

【JUC并发编程系列】深入理解Java并发机制:Volatile从底层原理解析到高级应用技巧(六、Volatile关键字、JMM、重排序、双重检验锁)

文章目录 【JUC并发编程系列】深入理解Java并发机制&#xff1a;Volatile从底层原理解析到高级应用技巧(六、Volatile关键字、JMM、重排序、双重检验锁)1. Volatile的特性2. Volatile的用法3. CPU多核硬件架构剖析4. JMM内存模型4.1 主要特性4.2 JMM 的工作原理4.3 实现机制 5.…

电商跨境电商商城系统/网上商城接口/电商数据接口详情

电商API接口背景&#xff1a;电商运营中&#xff0c;数据分析这项工作越来越重要&#xff0c;许多品牌方也越来越热衷去做电商数据分析。不过&#xff0c;全面的数据该如何获取呢&#xff0c;此时&#xff0c;电商数据接口的重要性便凸显出来了。 电商API数据接口主要有以下特…

ASP.NET Core8.0学习笔记(十九)——EF Core DbSet

一、DbSet概述 1.DbSet提供了通过DbContext对表进行查询操作的路径。DbSet对应的属性名称将默认映射为实体T的表名。 2.使用DbSet<T>进行查询的方法&#xff1a; (1)直接在DbContext中创建对应的DbSet<T>属性 (2)使用DbSet DbContext.Set<T>方法操作数据表。…