初学者怎么入门大语言模型(LLM)?看完这篇你就懂了!

当前2024年,LLM领域发展日新月异,很多新的实用技术层出不穷,个人认为要跟上LLM的发展,需要掌握以下内容,并需要不断地跟踪学习。

入门LLM前置基础

  • 深度学习基础知识:推荐李宏毅的深度学习课程
  • Python和numpy:推荐菜鸟教程
  • Pytorch框架的使用:推荐官方的60分钟教程

以上这些是敲门砖,默认已经掌握。

理论基础

  • Transformer:LLM基础组件,必需掌握
  • The Illustrated Transformer:图解Transformer,配合论文一起食用效果更佳
  • RoPE:当前大模型必备的位置编码
  • RMSNorm:LayerNorm的升级版(简化版),LLM最常用的归一化方法
  • GPT:GPT系列鼻祖论文
  • GPT2:Language Models are Unsupervised Multitask Learners
  • GPT-3:第一个千亿大模型,大力出奇迹
  • InstructGPT:ChatGPT前身
  • GPT4:OpenAI技术报告
  • LLama:最热门的开源LLM
  • LLama2:最热门的开源LLM,结合代码学习效果更好

掌握以上内容基本就能理解当前LLM的原理,对模型的计算过程有一个整体上的认识,就能知道为什么LLM的回答是一个接着一个输出的。

进阶知识

如果需要利用LLM完成应用或者对模型进行改进,就需要更加深入一点的了解。要掌握模型的训练推理过程,常见的加速方法以及前沿方向。

  • ZeROZeRO-Offload、ZeRO-Infinity:大模型训练微调最常用的DeepSpeed框架的基础
  • FlashAttention:现代LLM加速必备,白给的加速谁会不要?
  • PagedAttention:灵感来源于操作系统的LLM显存管理算法,把LLM显存开销打下来了
  • MQA、GQA:针对Attention模块的优化算法,多个Query共享Key和Value,加速推理
  • LoRA:低资源微调模型的方法,让没有A100的“科研平民”也能上手LLM微调的神器
  • MoE:混合专家模型,当前研究的热点,未来LLM的潜在新形态

实操教程

推荐以下三个项目:

nanoGPT:以GPT-2为Baseline,详细地介绍了LLM训练和推理的过程,代码简洁易懂,极适合入门实操。K神出品,必属精品

LLMs-from-scratch:一本正在连载中的书籍配套项目,从零开始教你如何实现并训练推理LLM,每一部分都有详细的notebook,可以单步执行,了解每一步模型都做了什么,把LLM拆开了揉碎了展现在你面前。

llama.cpp:一个没有第三方依赖的纯C++的高性能LLM推理框架,也能训练。支持当前大多数主流LLM,内容很丰富,上手使用也算简单。不过由于涉及底层优化,想要优化该项目的话需要一定的计算机底层知识,适合有一定经验的选手学习。

再推荐一本人大出版的大模型电子书籍《大语言模型》,详细介绍了语言模型的发展脉络和知识,不仅包含算法原理模型结构,还包含了数据处理和训练推理步骤讲解,甚至连代码都有中文注释,对新手友好。书中详细地介绍了LLM的训练、推理和评价阶段,训练阶段包含预训练、指令微调、偏好对齐等阶段步骤和数据处理,推理阶段介绍了解码算法、量化、蒸馏、剪枝等加速手段,评测部分介绍了常见的评测任务和指标,非常适合系统地入门学习LLM,这是我读过最适合新手的LLM书籍~

在这里插入图片描述

封面

在这里插入图片描述

如何系统的去学习大模型LLM ?

大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。

事实上,抢你饭碗的不是AI,而是会利用AI的人。

科大讯飞、阿里、华为等巨头公司发布AI产品后,很多中小企业也陆续进场!超高年薪,挖掘AI大模型人才! 如今大厂老板们,也更倾向于会AI的人,普通程序员,还有应对的机会吗?

与其焦虑……

不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!

但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高。

针对所有自学遇到困难的同学们,我帮大家系统梳理大模型学习脉络,将这份 LLM大模型资料 分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)👈

一、LLM大模型经典书籍

AI大模型已经成为了当今科技领域的一大热点,那以下这些大模型书籍就是非常不错的学习资源。

在这里插入图片描述

二、640套LLM大模型报告合集

这套包含640份报告的合集,涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)

在这里插入图片描述

三、LLM大模型系列视频教程

在这里插入图片描述

四、LLM大模型开源教程(LLaLA/Meta/chatglm/chatgpt)

在这里插入图片描述

LLM大模型学习路线

阶段1:AI大模型时代的基础理解

  • 目标:了解AI大模型的基本概念、发展历程和核心原理。

  • 内容

    • L1.1 人工智能简述与大模型起源
    • L1.2 大模型与通用人工智能
    • L1.3 GPT模型的发展历程
    • L1.4 模型工程
    • L1.4.1 知识大模型
    • L1.4.2 生产大模型
    • L1.4.3 模型工程方法论
    • L1.4.4 模型工程实践
    • L1.5 GPT应用案例

阶段2:AI大模型API应用开发工程

  • 目标:掌握AI大模型API的使用和开发,以及相关的编程技能。

  • 内容

    • L2.1 API接口
    • L2.1.1 OpenAI API接口
    • L2.1.2 Python接口接入
    • L2.1.3 BOT工具类框架
    • L2.1.4 代码示例
    • L2.2 Prompt框架
    • L2.3 流水线工程
    • L2.4 总结与展望

阶段3:AI大模型应用架构实践

  • 目标:深入理解AI大模型的应用架构,并能够进行私有化部署。

  • 内容

    • L3.1 Agent模型框架
    • L3.2 MetaGPT
    • L3.3 ChatGLM
    • L3.4 LLAMA
    • L3.5 其他大模型介绍

阶段4:AI大模型私有化部署

  • 目标:掌握多种AI大模型的私有化部署,包括多模态和特定领域模型。

  • 内容

    • L4.1 模型私有化部署概述
    • L4.2 模型私有化部署的关键技术
    • L4.3 模型私有化部署的实施步骤
    • L4.4 模型私有化部署的应用场景

这份 LLM大模型资料 包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)👈

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1543573.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

STM32(三)GPIO输出、LED及蜂鸣器操作

一、GPIO 1.GPIO介绍 2.GPIO结构 stm32寄存器有32位,GPIO是16位,是stm32的低16位。 3.GPIO模式 4.GPIO应用电路 二、LED操作 1.操作GPIO的三个步骤 (1)使用RCC开启GPIO时钟 (2)使用GPIO初始函数初始化…

动态规划算法:10.路径问题_地下城游戏_C++

目录 题目链接:174. 地下城游戏 - 力扣(LeetCode) 一、题目解析 题目:​编辑 解析: 二、算法原理 1、状态表示 2、状态转移方程 状态转移方程推理: 3、初始化 dp表初始化: 特殊位置初始化&#…

【AcWing】基础算法

目录 1、快速排序 1.1 快速排序 1.2 第k个数 2、归并排序 2.1 归并排序 2.2 逆序对的数量 3、二分 3.1 数的范围 3.2 数的三次方根 4、高精度 4.1 高精度加法 4.2 高精度减法 4.3 高精度乘法 4.4 高精度除法 5、前缀和与差分 5.1 前缀和 5.2 子矩阵的和 5.3 …

基于jsp的图书馆管理系统的设计与实现 (含源码+sql+视频导入教程+文档)

👉文末查看项目功能视频演示获取源码sql脚本视频导入教程视频 1 、功能描述 基于jsp的图书馆管理系统8拥有两种角色,分别为管理员和学生,具体功能如下: 管理员:图书管理、用户管理、违规处理、权限管理、个人信息修改…

某恩加密数据爬虫逆向分析

目标网站 aHR0cHM6Ly93d3cuZW5kYXRhLmNvbS5jbi9pbmRleC5odG1s 一、抓包分析 响应数据加密 二、逆向分析 下断点,刷新页面 一直往下跟栈,发现是在这进行的加密 内部实现逻辑 本地数据获取 本文章仅提供技术分享交流学习,不可对目标服务器造…

OpenAI最新GPT-o1-preview测评

OpenAI最新GPT-o1-preview测评 测试之后感觉这个相对GPT4o,能力上升了一个大的台阶,思考能力极强的最强GPT模型 之前用GPT4o测试过类似的题目,做的效果极差,答案直接就是错,这次GPT-o1-preview居然做对了,逻…

Ethernet 系列(3)-- 物理层测试::IOP Test::Cable diagnostics

车载以太网物理层IOP测试,即互操作性测试(Interop- erability Tests),用于验证车载以太网PHY(通常也称为收发器)的可靠性和检查PHY能否在给定的有限时间内建立稳定的链路;还用于车载以太网PHY的诊断&#x…

窗口函数性能提升50倍,PawSQL索引推荐实战案例

🌟引言 在数据驱动的现代世界,SQL查询的速度是应用程序快速响应的关键。尤其是那些涉及窗口函数的复杂查询,若缺乏恰当的索引支持,性能瓶颈可能会成为阻碍。本文将带您看看PawSQL是如何通过智能索引推荐,帮助一个包含…

《深度学习》—— 神经网络中常用的激活函数

文章目录 1. Sigmoid 激活函数2. Softmax 激活函数3. ReLU 激活函数4. Leaky ReLU 激活函数5. ELU 激活函数6. Tanh 激活函数 激活函数(Activation Function)是在人工神经网络的神经元上运行的函数,负责将神经元的输入映射到输出端。它在神经…

CVE-2024-4956实战

一、访问网页 二、公司信息域名收集 三、抓包读取敏感文件 Burpsuite抓包,修改GET请求即可(GET /%2F%2F%2F%2F%2F%2F%2F..%2F..%2F..%2F..%2F..%2F..%2F..%2Fetc%2Fpasswd HTTP/1.1 )

网工想提升,不止华为HCIE这一个证书

作为网络工程师,拥有一张HCIE(华为认证互联网专家)无疑是职业生涯中的一项重要成就,但网络技术的世界远比一张证书要复杂得多。提升自己的技术水平,不仅要依赖HCIE这一张证书,更可以通过学习其他认证&#…

现在的大模型榜单,真就没一个可信的,真的都是水分

现在的大模型榜单上,真的都是水分。 全是作弊的考生,真的。 上周,AI圈有个很炸裂的大模型发布,在全网引起了山呼海啸,一众从业者和媒体尊称它为开源新王。 就是Reflection 70B。 在每项基准测试上都超过了 GPT-4o&a…

printf 命令:格式化输出

一、命令简介 ​printf​ 命令在 Linux 系统中用于格式化并打印字符串到标准输出。它是 C 语言中 printf ​函数的命令行版本,因此其格式化选项与 C 语言中的非常相似。 相关命令: echo:通常使用 echo,它比较简单。printf&…

FastAPI开发环境搭建——开发第一个web程序

FastAPI开发环境搭建——开发第一个web程序 搭建开发环境 FastAPI官方文档学习 - FastAPI (tiangolo.com) 安装fastapi框架 pip install fastapi[all] pip install uvicorn使用对应IDE创建fastapi项目,例如pycharm,vscode和创建普通的python项目无差别 创建一个…

Solidity编码规范汇总篇

本文首发于公众号 【Keegan小钢】 上周,完成了 Solidity 编码规范的视频录制并上传到了 B 站、Youtube 和视频号。总共分为了 6 个小节,在 B 站的合集地址为: https://space.bilibili.com/60539794/channel/collectiondetail?sid3780183 为…

【ASE】第一课_双面着色器

今天我们一起来学习ASE插件,希望各位点个关注,一起跟随我的步伐 今天我们来学习双面着色器,对颜色和贴图进行差值,双面显示不同的效果 最终效果: 思路: 1.先确定前后面的贴图和颜色 贴图(Alb…

高效工程师的七个习惯

原文 我曾与一些杰出的工程师共事过 – 在诸如 FAANG 的大公司,也在初创规模的小公司。他们让我看到,传说中的「10 倍」工程师,真实存在! 如今,这些工程师中,有些人后来创办了自己的公司,他们…

kmp快速匹配

用处:对于一个较长的字符串A,判断A中是否存在字符串B。 思路: 暴力的做法是从A的每个元素开始,依次比较看是否有和B相同的子串,时间复杂度是o(N*N) 优化思路是对于每次查找完成以后&#xff…

springboot+vue宠物医院挂号看病诊断系统 f9h46

目录 宠物主人宠物医生系统管理人员系统实现截图技术介绍核心代码部分展示详细视频演示源码获取 宠物主人 登录注册:注册账户并登录系统。 首页:显示系统基本信息和用户导向功能。 个人中心:更新个人信息,包括联系方式、密码等。…

【AI创作组】工程方向的硕士研究生学习Matlab的路径

1. MATLAB软件概述 1.1 MATLAB发展历程 MATLAB自20世纪70年代诞生以来,已经经历了多次重要的版本更新和功能扩展。 初始版本:MATLAB的前身只是一个简单的交互式矩阵计算器,由Cleve B. Moler博士在1970年代初期开发,目的是为了方便学生和研究人员使用线性代数软件包LINPAC…