LLM(大语言模型)和AIGC入门学习路线图,零基础入门到精通,收藏这一篇就够了

大模型是指网络规模庞大的深度学习模型,其参数量通常在千亿级别。

学习大模型需要具备计算机基础,这一点非常重要!

要系统地入门大模型,首先需要学习深度学习的基础知识,包括神经网络(NN)、卷积神经网络(CNN)和循环神经网络(RNN)等。

在学习完基础知识后,你可以借助开源算法来学习如何使用大模型进行自然语言处理任务。目前有很多大模型开源算法可供学习和使用。你可以选择一些经典的大模型算法,如BERT、GPT-2和Transformer等,通过阅读相关的论文和代码实现来深入了解它们的工作原理和应用场景。

本文旨在提供系统的学习路径和实践项目,帮助你更好地掌握大模型的使用和应用。

学习路径

本文分为四个章节,各章节的学习目标如下。请注意本文主要是面向工程界撰写,学术部分较少。

入门篇

  • 了解大语言模型的基础知识和常见术语。

  • 学会使用编程语言访问 OpenAI API 等常见大语言模型接口。

提高篇

  • 了解机器学习、神经网络、NLP 的基础知识。

  • 了解 Transformer 以及典型 Decoder-only 语言模型的基础结构和简单原理。

  • 了解大语言模型发展历史,以及业界主流模型(含开源模型)进展。

应用篇

  • 可以在本地环境搭建开源模型的推理环境。Prompt 工程。

  • 使用已有框架(如Langchain)或自行开发,结合大语言模型结果,开发生产应用。

深入篇(本文涉及少量资料)

  • 掌握 Continue Pre-train、Fine-tuning 已有开源模型的能力。

  • 掌握 Lora、QLora 等低资源高效模型训练的能力。

  • 掌握大语言模型微调以及预训练数据准备的能力。

  • 深入了解大模型背后的技术原理。

  • 了解生产环境部署大模型的相关技术点。

读者可以根据自己需要选择对应的章节,如对大语言模型的原理不感兴趣,可只关注入门篇和应用篇。考虑到阅读背景,本文尽可能提供中文资料或有中文翻译的资料。

入门篇

在入门之前,请申请 OpenAI API,并具备良好的国际互联网访问条件。

大语言模型综述 大语言模型迄今为止最好的学术向中文综述。中文版本:LLM_Survey_Chinese_0418.pdf 作为入门资料偏难,看不懂的部分可以等到后面章节再回头重看。ChatGPT Prompt Engineering for Developers 虽然是 Prompt 工程,但是内容比较简单,适合入门者。

中英双语字幕:https://github.com/GitHubDaily/ChatGPT-Prompt-Engineering-for-Developers-in-Chinese OpenAI Quickstart OpenAI 官方 Quickstart 文档。以及 API Reference State of GPT:GPT 联合创始人做的演示,极好的总结了 GPT 的训练和应用。

视频:https://www.youtube.com/watch?v=bZQun8Y4L2A PPT:https://karpathy.ai/stateofgpt.pdf

提高篇

清华大模型公开课:从NLP到大模型的综合课程,挑选感兴趣的了解。

深度学习:台湾大学李宏毅:台湾大学李宏毅,国语教程里最好的,讲的很清楚,也比较有趣。Understanding large language models :理解大语言模型。The Illustrated GPT-2 (Visualizing Transformer Language Models):图解 GPT2 中文翻译:https://zhuanlan.zhihu.com/p/139840113

InstructGPT: Training language models to follow instructions with human feedback:著名的 InstructGPT 论文。另外一篇中文介绍:https://huggingface.co/blog/zh/rlhf Huggingface NLP Course:NLP 入门课程 0x30 应用篇 Building Systems with the ChatGPT API 中文字幕:https://www.bilibili.com/video/BV1gj411X72B/ Langchain Langchain 是大语言模型最火的应用框架。即使不使用,也可以借鉴。

LangChain for LLM Application Development 中文字幕:https://www.bilibili.com/video/BV1Ku411x78m/ GPT best practices:OpenAI 官方出的最佳实践。openai-cookbook:OpenAI 官方 Cookbook。Brex’s Prompt Engineering Guide:Prompt 工程简介

深入篇

Huggingface Transformer 文档:Transformer 官方文档

复杂推理:大语言模型的北极星能力 :略学术,解释大语言模型能力的来源。

GPT,GPT-2,GPT-3 论文精读:视频精读。Building LLM applications for production:在生产环境中构建 LLM 应用。

AI大模型学习福利

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

2024最新版CSDN大礼包:《AGI大模型学习资源包》免费分享

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

2024最新版CSDN大礼包:《AGI大模型学习资源包》免费分享

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

2024最新版CSDN大礼包:《AGI大模型学习资源包》免费分享

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

2024最新版CSDN大礼包:《AGI大模型学习资源包》免费分享

四、AI大模型商业化落地方案

img

因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

2024最新版CSDN大礼包:《AGI大模型学习资源包》免费分享

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1540325.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

nvm node管理工具常用指令

注:使用nvm之前需要卸载掉原有的node 1.在终端输入 nvm list available, 查看网络可以安装的版本。 点击visit后面的链接可查看完整版本列表 版本区别: CURRENT:当前正在使用的 Node.js 版本。LTS(Long Term Suppor…

java踩坑

1.mybatis在idea可以正常运行,但是打jar包后,就报链接超时,可能是参数设置有问题,但是idea自动忽略了。 出问题的配置:(圈出来的地方乱码了,idea有纠错能力,它自动调整为正确的&…

电脑录课软件哪个好用,提高教学效率?电脑微课录屏软件推荐

在当今这个数字化时代,教育领域也迎来了翻天覆地的变化。随着远程教学和在线学习的普及,教师们开始寻求更高效、更便捷的教学工具来提升教学质量和学生的学习体验。电脑录课软件,作为现代教育技术的重要组成部分,能够帮助教师轻松…

基于存内计算架构的模型部署与映射优化

先进计算大赛背景: ‘’存内计算”架构通过消除存储与计算单元间的物理距离,突破传统冯诺依曼架构的限制,自2016年起受到广泛关注,被视为国产算力发展的关键技术。 ​ 在存内计算架构中,权重布局对提高存算单元利用率…

海外盲盒APP为盲盒出海助力,拓展海外市场

潮玩市场是一个具有全球化的行业在全球都具有非常高的发展潜力,随着国内盲盒市场的饱和,拓展海外市场对盲盒企业至关重要。近年来,盲盒已经在海外市场取得了一定的成绩,这为企业拓展海外市场奠定了发展基础。 目前,在…

虚拟机(VMware)安装,保姆级教程(附所有安装包及所有安装步骤)

1.安装包下载 1.1VMware下载 VMware安装包 提取码:b9ds 1.2镜像下载 镜像安装包 提取码:hbtq 2.配置虚拟机向导 2.1配置虚拟机向导 2.2选择虚拟机硬件兼容性 2.3安装客户机操作系统 2.4简易安装信息 2.5命名虚拟机 2.6处理器配置 #这个根据自己…

“数字化、数字化流程、流程数字化转型、端到端流程”概念解析

​头一次看到能把“数字化”“数字化流程”“流程数字化转型”和“端到端流程”说的这么清楚的! 所谓的“数字化”是指新一代的数字化技术,比如移动、社交、云技术、大数据、人工智能、区块链、数字孪生等。这批新技术已经开始改变人们的工作方式&#x…

VBA技术资料MF198:禁用下拉拖放

我给VBA的定义:VBA是个人小型自动化处理的有效工具。利用好了,可以大大提高自己的工作效率,而且可以提高数据的准确度。“VBA语言専攻”提供的教程一共九套,分为初级、中级、高级三大部分,教程是对VBA的系统讲解&#…

案例精选 | 聚铭助力河北省某市公安局筑牢网络安全防护屏障

近年来,各级公安机关积极响应信息化发展趋势,致力于提升公安工作的效能与核心战斗力。河北省某市公安局作为主管全市公安工作的市政府部门,承担着打击违法犯罪、维护社会稳定的重任。随着信息化建设的推进,局内系统数量、种类及数…

模板初阶(C++)

初识模板 模板分为 函数模板和类模板这两种,模板可以理解为是一套固有的方法,通过改变里面不同的载体( 参数类型)进而调高代码的复用性。这是一个经典案例,在不使用模板的情况下,若遇见不同类型的参数&…

Linux——k8s认识

计算资源隔离 - 更方便进行高并发架构的维护和升级 - 架构管理的灵活性更高,不再以单个节点的物理资源作为基础 技术: - 硬件辅助虚拟化 - 容器技术 在企业部署方案中,很少以单节点实现虚拟化和容器技术,一般以集群状态来运…

PCL KD树的使用

目录 一、概述 1.1原理 1.1.1 数据拆分过程 1.1.2 树的构建示例 1.2实现步骤 1.3应用场景 二、代码实现 2.1关键函数 2.1.1KD树构建与查询: 2.1.2 k近邻搜索 2.1.3半径搜索 2.2完整代码 三、实现效果 3.1处理后点云 3.2数据显示 PCL点云算法汇总及实战…

neo4j导入csv数据

neo4j数据可视化实践 手动输入数据 - 官方democsv数据导入准备数据数据处理导入步骤① 导入疾病表格② 导入药物表格③导入疾病-药物关系表格 爬虫的csv文件 手动输入数据 - 官方demo 点击之后,按照左边10张图中的代码,复制粘贴熟悉语法 效果如下 csv数据…

(十六)Ubuntu 20.04 下搭建PX4+MATLAB 仿真环境(HITL)

在文章(十五)Ubuntu 20.04 下搭建PX4MATLAB 仿真环境我们学习了如何配置仿真环境,在本节,主要进行HITL的仿真环境搭建。 根据(十五)Ubuntu 20.04 下搭建PX4MATLAB 仿真环境完成配置到如下界面:…

STM32F1+HAL库+FreeTOTS学习11——延时函数API

STM32F1HAL库FreeTOTS学习11——延时函数API 延时函数API1. vTaskDelay()2. vTaskDelayUntil()3. xTaskDelayUntil()相对延时和绝对延时的区别4. xTaskAbortDelay() 上一期,我们学习了任务相关API使用,这一期我们开始学习FreeRTOS延时函数的API使用 延时…

MySQL--导入SQL文件(命令行导入)

MySQL--导入SQL文件 一、前言二、导入SQL文件 一、前言 用可视化编辑工具编写,并且在控制台输入命令行在MySQL中导入SQL文件。 在导入SQL文件之前查看了目前存在的数据库 **目标:**在可视化编辑工具(这里以word文档为例)中编写SQL语句&…

【算法竞赛】栈

栈的特点是"先进后出"。 栈在生活中的原型有:坐电梯,先进电梯的被挤在最里面,只能最后出来;一管泡腾片,最先放进管子的药片位于最底层,最后被拿出来。 栈只有唯一的出入口,从这个口进入,也从这个口弹出,这是它与队列最大的区别。 队列有一个入…

【动态规划】最大正方形

最大正方形(难度:中等) 该题对应力扣网址 思路 min_valuemin({dp[i-1][j-1],dp[i-1][j],dp[i][j-1]}) dp[i][j]min_value 关键点是正方形的右下角(n>1时),通过画图,可以看出,在基础正方形22中&#x…

unordered_map/set(底层实现)——C++

目录 前言: 1.开散列 1. 开散列概念 2. 开散列实现 2.1哈希链表结构体的定义 2.2哈希表类即私有成员变量 2.3哈希表的初始化 2.4迭代器的实现 1.迭代器的结构 2.构造 3.* 4.-> 5. 6.! 2.5begin和end 2.6插入 2.7Find查找 2.8erase删除 3.unordered_ma…

在vue中:style 的几种使用方式

在日常开发中:style的使用也是比较常见的&#xff1a; 亲测有效 1.最通用的写法 <p :style"{fontFamily:arr.conFontFamily,color:arr.conFontColor,backgroundColor:arr.conBgColor}">{{con.title}}</p> 2.三元表达式 <a :style"{height:…