从“NLP技术”到“AI大模型”

从“NLP技术”到“AI大模型”

news/2024/10/5 20:25:04/文章来源:https://blog.csdn.net/2401_85325726/article/details/140208863

自从AI大模型问世以来，仿佛很少有人提及NLP技术这个词了。昨天休息的时候突然在想一个问题，AI大模型已经如此强大了，还需要传统的NLP技术吗？

传统的NLP技术指：从分词（ws）、词性标注（pos）、命名实体识别（ner）、依存句法分析（dp）、语义角色标注（srl）等过程。

传统的NLP技术主要应用一些基于规则、统计学的机器学习模型来实现。而AI大模型核心是基于词嵌入技术来进行实现，相当于是一种暴力解题的方式，通过超大规模参数来达到模型涌现的能力。

二者最核心的区别在于2个：一个是训练所需的数据不在同一个一个数量级上，传统的NLP技术处理的更多的是企业内部定向任务的数据，而AI大模型则应用全网数据来实现；另一个则是在技术实现的抽象层次不同。

NLP技术是直接应用人力可以理解的语言规则来实现；而AI大模型则是将语言规则抽象成向量，然后通过深度神经网络来进行训练，在神经网络中面对抽象后的高维向量，人力已无法理解，这也是AI大模型的解释性比较差的原因。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

在让机器理解人类语言这件事儿上，现在看来可以划分为2个阶段：NLP技术阶段、和AI大模型阶段，每个阶段都有其独特的技术特点和里程碑事件。以下是这两个阶段的技术演变过程的详细梳理。

一、传统NLP技术阶段

1. 早期方法（1950s – 1990s）

早期的NLP主要依赖于规则-based的方法和基于词典的系统。技术包括语法分析、模式匹配、关键词提取等。

2. 统计学习方法的兴起（1990s – 2000s）

统计学习方法开始应用于NLP，如隐马尔可夫模型（HMM）和条件随机场（CRF）。这些方法能够处理序列数据，并且对标记数据的需求较少。

一款产品无到有，产品经理需要做些什么？在一个产品从无到有的过程中，要做好产品经理这个角色实在是不容易，除了大家都知道的写需求、写需求、写需求，要做的事多着呢。产品经理不是你眼中的只会找你麻烦，提要求…查看详情 >

3. 浅层和深层学习（2000s – 2010s）

特征工程和机器学习方法（如支持向量机SVM）在这一时期得到了广泛应用。出现了一些重要的NLP任务，如情感分析、命名实体识别、机器翻译等。

4. 语义角色标注和语义解析（1998 – 2000s）

FrameNet和语义角色标注的提出，推动了浅层语义解析的发展。共享任务和评估标准（如CoNLL）促进了核心NLP任务的研究。

二、AI大模型阶段

1. 词嵌入的革命（2013年前后）

Word2Vec和GloVe等词嵌入技术的提出，使得NLP能够更好地捕捉词汇的语义信息。词嵌入技术的出现为后续的深度学习模型奠定了基础。

2. 神经网络的突破（2013年 – 2014年）

循环神经网络（RNN）、卷积神经网络（CNN）、长短期记忆网络（LSTM）开始应用于NLP任务。这些网络能够捕捉文本数据中的序列特征和局部依赖关系。

3. 预训练语言模型的兴起（2018年前后）

BERT、GPT、XLNet等预训练语言模型的出现，极大地推动了NLP技术的发展。这些模型通过在大规模文本数据上进行预训练，学习到了丰富的语言表示。

4. Transformer架构的普及（2017年 – 至今）

Transformer架构的提出，特别是在BERT和GPT系列模型中的应用，成为了NLP领域的核心技术。Transformer能够有效处理长距离依赖问题，并且支持多任务学习和迁移学习。

5. 大模型的挑战与创新（2022年代）

大模型虽然在多个NLP任务上取得了显著的性能提升，但也面临着诸如可解释性、偏见、伦理和隐私等挑战。研究人员和开发者正在探索如何设计和训练更加安全、可控和可解释的大模型。

三、总结

传统的NLP技术是人类探索机器理解自然语言的一个过程，如果没有这个过程，那么后面的词嵌入、预训练模型、以及AI大模型可能就不会诞生了，正是由于传统NLP技术在应用层的惰性，才激发了研究人员的新思考，做出重大突破。

所以，回到文初的那个问题：AI大模型已经如此强大了，还需要传统的NLP技术吗？

当然如果你是从事应用层工作的人员，个人觉得不需要再去研究传统的NLP技术了，直接从词嵌入阶段开始了解即可。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

而如果你是偏科研方面的工作人员，则非常有必要去研究一下，传统的NLP技术，知其因，才能更好的解其果，这是奠定科研工作的基础。‍‍‍‍‍‍‍‍‍

读者福利：如果大家对大模型感兴趣，这套大模型学习资料一定对你有用

对于0基础小白入门：

如果你是零基础小白，想快速入门大模型是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

资源分享

大模型AGI学习包

资料目录

成长路线图&学习规划
配套视频教程
实战LLM
人工智能比赛资料
AI人工智能必读书单
面试题合集

《人工智能\大模型入门学习大礼包》，可以扫描下方二维码免费领取！

1.成长路线图&学习规划

要学习一门新的技术，作为新手一定要先学习成长路线图，方向不对，努力白费。

对于从来没有接触过网络安全的同学，我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线，大家跟着这个大的方向学习准没问题。

2.视频教程

很多朋友都不喜欢晦涩的文字，我也为大家准备了视频教程，其中一共有21个章节，每个章节都是当前板块的精华浓缩。

3.LLM

大家最喜欢也是最关心的LLM（大语言模型）

《人工智能\大模型入门学习大礼包》，可以扫描下方二维码免费领取！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.xdnf.cn/news/1472653.html

如若内容造成侵权/违法违规/事实不符，请联系一条长河网进行投诉反馈，一经查实，立即删除！

相关文章

STM32智能家居安防系统教程

STM32智能家居安防系统教程

目录引言环境准备智能家居安防系统基础代码实现：实现智能家居安防系统 4.1 数据采集模块 4.2 数据处理与分析 4.3 控制系统实现 4.4 用户界面与数据可视化应用场景：安防管理与优化问题解决方案与优化收尾与总结 1. 引言智能家居安防系统利用STM32嵌…

阅读更多...

c/c++ 程序运行的过程分析

c/c++ 程序运行的过程分析

c/c编译基础知识 GNU GNU（GNU’s Not Unix!）是一个由理查德斯托曼（Richard Stallman）在1983年发起的自由软件项目，旨在创建一个完全自由的操作系统，包括操作系统的内核、编译器、工具、库、文本编辑器、邮…

阅读更多...

【读点论文】基于二维伽马函数的光照不均匀图像自适应校正算法

【读点论文】基于二维伽马函数的光照不均匀图像自适应校正算法

基于二维伽马函数的光照不均匀图像自适应校正算法摘要:提出了一种基于二维伽马函数的光照不均匀图像自适应校正算法.利用多尺度高斯函数提取出场景的光照分量,然后构造了一种二维伽马函数,并利用光照分量的分布特性调整二维伽马函数的参数,降低光照过强区域图像的亮度值,提高…

阅读更多...

惠海 H6225K 降压恒压芯片支持12V24V36V48V60V转3.3V 5V车载仪器仪表方案

惠海 H6225K 降压恒压芯片支持12V24V36V48V60V转3.3V 5V车载仪器仪表方案

H6225K是一种内置60V耐压MOS，支持输入高达48V的高压降压开关控制器，可以向负载提供2.5A的连续电流。H6225K支持输出恒定电压，可以通过调节VFB采样电阻来设置输出电压，同时支持最大电流限制，可以通过修改CS采样电阻来设…

阅读更多...

期权学习必看圣书：《3小时快学期权》要在哪里看？

期权学习必看圣书：《3小时快学期权》要在哪里看？

今天带你了解期权学习必看圣书：《3小时快学期权》要在哪里看？《3小时快学期权》是一本关于股票期权基础知识的书籍。它旨在通过简明、易懂的语言和实用的案例，让读者在短时间内掌握股票期权的基本概念、操作方法和投资策略。通过这本书&…

阅读更多...

Python酷库之旅-第三方库Pandas(004)

Python酷库之旅-第三方库Pandas(004)

目录一、用法精讲 5、pandas.DataFrame.to_csv函数 5-1、语法 5-2、参数 5-3、功能 5-4、返回值 5-5、说明 5-6、用法 5-6-1、代码示例 5-6-2、结果输出 6、pandas.read_fwf函数 6-1、语法 6-2、参数 6-3、功能 6-4、返回值 6-5、说明 6-6、用法 6-6-1、代码…

阅读更多...

从海上长城到数字防线：视频技术在海域边防现代化中的创新应用

从海上长城到数字防线：视频技术在海域边防现代化中的创新应用

随着全球化和科技发展的加速，海域安全问题日益凸显其重要性。海域边防作为国家安全的第一道防线，其监控和管理面临着诸多挑战。近年来，视频技术的快速发展为海域边防场景提供了新的解决方案，其高效、实时、远程的监控特点极大地提…

阅读更多...

QWidget成员函数功能和使用详细说明（四）（文字+用例+代码+效果图）

QWidget成员函数功能和使用详细说明（四）（文字+用例+代码+效果图）

文章目录 1.测试工程配置2.成员函数2.1 void setParent(QWidget *parent)2.2 void setMouseTracking(bool enable)2.3 bool hasMouseTracking() const2.4 void setPalette(const QPalette &)2.5 const QPalette &palette() const2.6 int QWidget::grabShortcut(const Q…

阅读更多...

Java 并发集合：CopyOnWrite 写时复制集合介绍

Java 并发集合：CopyOnWrite 写时复制集合介绍

大家好，我是栗筝i，这篇文章是我的 “栗筝i 的 Java 技术栈” 专栏的第 016 篇文章，在 “栗筝i 的 Java 技术栈” 这个专栏中我会持续为大家更新 Java 技术相关全套技术栈内容。专栏的主要目标是已经有一定 Java 开发经验，并希望进…

阅读更多...

【深度学习】图形模型基础(5)：线性回归模型第二部分：单变量线性回归模型

【深度学习】图形模型基础(5)：线性回归模型第二部分：单变量线性回归模型

1.引言在统计学与机器学习的广阔领域中，线性回归作为一种基础而强大的预测技术，其核心在于通过输入变量（或称预测器、自变量）来估计输出变量（响应变量、因变量）的连续值。本章聚焦于线性回归的一个基本但…

阅读更多...

hnust 1815: 算法10-6~10-8：快速排序

hnust 1815: 算法10-6~10-8：快速排序

hnust 1815: 算法10-6~10-8：快速排序题目描述快速排序是对起泡排序的一种改进。它的基本思想是，通过一趟排序将待排序的记录分割成两个独立的部分，其中一部分记录的关键字均比另一部分的关键字小，在分成两个部分之后则可以分别…

阅读更多...

记一次漏洞挖掘【网络安全】

记一次漏洞挖掘【网络安全】

漏洞信息从CVE-2019-10999查看该CVE的基础信息得知，这是一个栈溢出漏洞，攻击者在已登录的情况下可以通过向wireless.htm发送一个超长的WEPEncryption参数导致栈溢出，从而执行任意命令攻击. 现在我们利用Shambles Desktop工具确定这个漏洞的…

阅读更多...

OpenCV基础（2）

OpenCV基础（2）

目录滤波处理均值滤波基本原理函数用法程序示例高斯滤波基本原理函数用法程序示例中值滤波基本原理函数用法程序示例形态学腐蚀膨胀通用形态学函数前言：本部分是上一篇文章的延续，前面部分请查看：OpenCV…

阅读更多...

计算机网络之以太网

计算机网络之以太网

上文内容：总线局域网以及冲突的解决方法 1.以太网的起源 1.1起源 60年代末期，夏威夷大学Norman Abramson等研制ALOHA无线网络系统,实现Oahu岛上的主机和其它岛及船上的读卡机和终端通信； 出境信道地址：主机到终端&#xff1…

阅读更多...

空间数据获取与预处理指南：生产与科研应用

1.空间数据简介 2.免费的国外GIS数据下载方法 3.免费的国内GIS数据下载方法 4.遥感云平台数据的获取方法 5.专题数据的获取及预处理示例 (1)行政区划数据 (2)气象数据 (3)土壤数据 (4)遥感产品数据 (5)统计数据 (6)…… 原文链接https://mp.weixin.qq.com/s?__bizMz…

阅读更多...

Mean teacher are better role models-论文笔记

Mean teacher are better role models-论文笔记

论文笔记资料 1.代码地址 2.论文地址 https://arxiv.org/pdf/1703.01780 3.数据集地址 CIFAR-10 https://www.cs.utoronto.ca/~kriz/cifar.html 论文摘要的翻译最近提出的Temporal Ensembling方法在几个半监督学习基准中取得了最先进的结果。它维护每个训练样本的标签…

阅读更多...

打赢网络免疫升级战！看聚铭铭察高级威胁检测系统如何重塑网络安全防线

打赢网络免疫升级战！看聚铭铭察高级威胁检测系统如何重塑网络安全防线

在信息洪流的今天，企业如航行于暗礁密布的数字海洋，面对的不仅仅是已知的病毒与漏洞，更有高级威胁这股暗流，悄无声息地侵蚀着网络的肌理。常规的安全措施，犹如常规体检，虽能捕捉表面的异常，却难…

阅读更多...

竹云实力入选《现代企业零信任网络建设应用指南报告》代表性厂商

竹云实力入选《现代企业零信任网络建设应用指南报告》代表性厂商

2024年7月3日，国内网络安全媒体安全牛正式发布《现代企业零信任网络建设应用指南报告(2024版)》。竹云凭借在零信任领域创新性的产品方案和优异的市场表现，实力入选代表性厂商。伴随着云计算、AI、大数据等技术的发展，远程办公、业务协同、…

阅读更多...

spring boot 接口参数解密和返回值加密

spring boot 接口参数解密和返回值加密

spring boot 接口参数解密和返回值加密开发背景简介安装配置yml 方式Bean 方式试一下启动项目返回值加密参数解密body 参数解密param和form-data参数解密总结开发背景虽然使用 HTTPS 已经可以基本保证传输数据的安全性，但是很多国企、医疗、股票项目等仍然要求…

阅读更多...

聚鼎科技：装饰画现在做晚不晚

聚鼎科技：装饰画现在做晚不晚

在每一处光影交错的角落，墙上那一副副静默无言的装饰画，似乎总在诉说着不同的故事。如今，投身于装饰画的创作与收藏，仿佛是一场关于美和时间的赛跑，那么问题来了——现在开始，晚吗? 伴随着生活品质的提升和…

阅读更多...

最新文章