【新书】从零构建大型语言模型,370页pdf

学习如何从零开始创建、训练和调整大型语言模型(LLMs)

在《从零构建大型语言模型》一书中,畅销书作者塞巴斯蒂安·拉什卡(Sebastian Raschka**)将一步步指导你创建自己的LLM。每个阶段都有清晰的文字、图表和示例解释。从最初的设计和创建,到基于通用语料库的预训练,再到为特定任务进行微调,你将全面掌握每个步骤。

在这里插入图片描述

👉CSDN大礼包🎁:新书:从零构建大型语言模型免费分享(安全链接,放心点击)👈

《从零构建大型语言模型》教你如何:

  • 规划和编写LLM的所有组件代码
  • 准备适合LLM训练的数据集
  • 为文本分类及自有数据微调LLM
  • 使用人类反馈确保LLM遵循指令
  • 将预训练的权重加载到LLM中

《从零构建大型语言模型》将带你深入AI的“黑箱”,让你调整生成式AI**的内部系统。在LLM创建的每个关键阶段,你将深入理解LLM的工作原理、它们的局限性以及它们的定制方法。你可以在普通笔记本电脑上开发LLM,并将其用作个人助手。

购买纸质书还可免费获得Manning Publications提供的PDF和ePub格式的电子书。

关于技术

据说物理学家理查德·费曼**(Richard P. Feynman)曾表示:“我无法理解任何我不能自己构建的东西。”基于这一强大的原则,畅销书作者塞巴斯蒂安·拉什卡将引导你逐步构建一个GPT风格的LLM,它可以在你的笔记本电脑上运行。这是一本引人入胜的书籍,涵盖了从规划、编码到训练和微调的每个阶段。

关于本书

《从零构建大型语言模型》是一段充满实践性和成就感的动手旅程,深入探索生成式AI的基础。在不依赖任何现有LLM库的情况下,你将编写一个基础模型,将其发展为文本分类器,最终创建一个可以按照对话指令进行交互的聊天机器人。而且你会真正理解它,因为你是自己构建的!

书中内容

  • 规划并编写一个与GPT-2相当的LLM
  • 加载预训练权重
  • 构建完整的训练管道
  • 为文本分类微调LLM
  • 开发遵循人类指令的LLM

读者对象

读者需要具备中级的Python技能和一些机器学习知识。你所创建的LLM可以在任何现代笔记本电脑上运行,并且可以选择使用GPU。

作者简介

塞巴斯蒂安·拉什卡(Sebastian Raschka)是Lightning AI的研究工程师,专注于LLM研究并开发开源软件**。

本书的技术编辑是大卫·卡斯韦尔(David Caswell)。

目录

  1. 了解大型语言模型
  2. 处理文本数据
  3. 编写注意力机制
  4. 从零实现GPT模型生成文本
  5. 在无标签数据上进行预训练
  6. 为分类进行微调
  7. 为遵循指令进行微调
    附录A PyTorch简介
    附录B 参考文献和延伸阅读
    附录C 习题答案
    附录D 为训练循环增加附加功能
    附录E 使用LoRA**进行参数高效微调

作者简介

塞巴斯蒂安·拉什卡从事机器学习和AI领域已有十多年。他于2022年加入Lightning AI,专注于AI和LLM研究,开发开源软件,并创作教育材料。在此之前,塞巴斯蒂安曾在威斯康星大学麦迪逊分校统计系担任助理教授,专注于深度学习和机器学习的研究。他对教育充满热情,以其畅销的开源软件机器学习书籍闻名。

在这里插入图片描述

在这里插入图片描述

👉CSDN大礼包🎁:新书:从零构建大型语言模型免费分享(安全链接,放心点击)👈

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/149170.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

【Python】生成dataframe的测试样例,用于测试一个或者多个dataframe

我们在处理dataframe测试时,发现,总需要重新构造一个新的dataframe,每次想找个现成的就想抓狂。 所以,为了方便随用随拿,我在这里直接保存一个直接生成dataframe 的方法。 1. 生成一个随机dataframe的方法&#xff1…

1688店铺装修模板1688店铺怎么装修1688装修模板1688店铺装修教程视频1688运营阿里巴巴店铺装修设计阿里店铺首页怎么装修产品分类效果

侧边栏装修效果,代码1688店铺怎么装修1688装修模板1688店铺装修教程视频1688运营阿里巴巴店铺装修设计阿里店铺首页怎么装修 工具是一秒美工助手

食家巷苦豆粉,香得很哟

苦豆粉,它看似普通,却承载着西北的厚重历史与浓郁风情。那一抹淡淡的绿色粉末,蕴含着大自然的馈赠和西北人民的智慧。 苦豆,这种生长在西北土地上的植物,经过精心研磨,变成了细腻的苦豆粉。它的味道独特&am…

python对文件的写入和追加

写入文件 1.打开文件 文件可以是不存在的,不存在就会创建 f open(./test.txt, w, encoding"utf-8")2.写数据到内存中 f.write("你好,世界")3.写到硬盘中 f.flush()#或者 close()有刷新的功能 f.close()整体代码 #打开文件 f …

鲲鹏计算这五年:硬生态基本盘稳住,才能放手进击软生态

文 | 智能相对论 作者 | 叶远风 数智化深入发展、新质生产力成为主旋律的当下,本土计算产业的发展被寄予越来越多的关注和期待。自2019年开启以来,鲲鹏计算产业生态已经整整走过5个年头。 因此,今年华为全联接大会的鲲鹏之夜,在…

还在用windows自带录屏?试试这三款录屏工具

作为一名办公室文员,我经常需要录制电脑屏幕来制作教程或者记录工作流程。在众多的录屏工具中,我尝试了四款不同的录屏工具,包括Windows自带录屏工具。今天,我就来跟大家分享一下我的使用体验,希望能帮助到和我有同样需…

在视频上绘制区域:使用Vue和JavaScript实现交互式画布

在数字时代,交互式媒体内容的创建和消费变得越来越普遍。特别是视频内容,它不仅提供了视觉信息,还允许用户与之互动,从而增强了用户体验。本文将介绍如何使用Vue.js框架和JavaScript创建一个交互式组件,该组件允许用户…

谷歌老户的优势及优化策略,增加曝光度方法介绍

谷歌老户(已存在一段时间并积累了历史数据的账户)通常具有较高的权重和稳定性,这使其在投放广告时可以更快速地增加流量并保持稳定的表现。以下是一些策略和建议,帮助您最大化利用谷歌老户的优势。 一、它的优势: 账…

Cherry Studio:开启AI智能工作的新篇章

引言 在当今快速发展的科技时代,如何高效利用人工智能技术提升工作效率,成为了各行各业专业人士的共同追求。🍒 Cherry Studio 正是为此而生,它是一款支持多模型服务的桌面客户端,内置了超过 30 个行业的智能助手&…

MDS130-16-ASEMI充电桩专用MDS130-16

编辑:ll MDS130-16-ASEMI充电桩专用MDS130-16 型号:MDS130-16 品牌:ASEMI 封装:DXT-5 批号:2024 现货:50000 最大重复峰值反向电压:1600V 最大正向平均整流电流(Vdss):130A …

VOC2007数据集

目标检测入门code 文件目录 下载数据集——在官网下载VOC2007数据集 下载训练数据集 TRAIN data 下载测试数据集 TEST data 解压数据集 解压——训练数据集,在服务器上,目录为VOCdevkit 部分文件目录 全部文件总目录 解压——测试数据集 (…

828华为云征文|云服务器Flexus X实例评测体验之搭建MySQL数据库

全文目录: 一、前言二、Flexus X云服务器2.1 Flexus X实例概述2.2 为什么选择 Flexus X实例? 三、购选及登录教程3.1 如何选购Flexus X?3.2 登录方式选择 四、安装 MySQL4.1 安装MySQL依赖库4.2 下载MySQL安装包4.3 上传MySQL安装包4.4 解压M…

3D 模型GLTF、GLB格式文件介绍使用

一、介绍 GLTF(GL Transmission Format)和 GLB(GL Binary)是用于在 Web 和各种应用程序中传输和加载 3D 场景和模型的开放标准格式。它们由 Khronos Group 开发,旨在提供一种高效、可扩展且易于使用的 3D 内容格式。以…

CCRC-DSA数据安全评估师:数据安全架构是什么?

架构不仅是抽象的概念,更是项目规划、系统开发、产品部署和安全增强中必不可少的思维模式、沟通桥梁和共享语言。 简言之,它定义了系统中包含的元素及其相互关系,这些元素被称为组件或逻辑模块。 例如,“组件”指独立存在的基础…

matlab之数据处理:滑动平均滤波算法与五点三次平滑算法

关注微♥公众号:“电击小子程高兴的MATLAB小屋”获取专属优惠 一.滑动平均滤波算法 算数平均滤波需要多次采样后才能得出一个有效值,如果被检测量变化较快,多次采样后才输出一次有效值,表现就是系统反应迟钝。将当前采样值与之前…

java后端字节一面

1. 我现在和你进行视频通话,这个是怎么做的? 视频通话通常基于实时通信技术(RTC),如WebRTC。它利用现代浏览器的API来实现视频、音频和数据的直接P2P(点对点)通信,或通过服务器中转。…

【小程序】uniapp自定义图标组件可动态更换svg颜色

组件描述 通过图标名称加载对应svg,size参数调整图标大小,color参数调整图标颜色 解决思路: 存svg获svg,对象方式正则替换svg的fill值,不改变源文件,通过base64直接加载缓存svg源文件,避免重…

动态时间【JavaScript】

这个代码实现了一个动态显示当前日期和时间的功能。具体来说&#xff0c;它会每秒更新一次时间并在页面上显示出来。 实现效果&#xff1a; 代码&#xff1a; <!DOCTYPE html> <html lang"zh"> <head><meta charset"UTF-8"><…

关于在Facebook风控中生存的建议

在Facebook广告投放和账户管理的过程中&#xff0c;面对严格的风控机制&#xff0c;如何确保账户的安全与稳定运营是很多小伙伴关注的重点。以下是一些策略和建议&#xff0c;希望能帮助你在Facebook风控的浪潮中稳健前行。 一、风险支付管理 首先&#xff0c;需要明确风险支付…

win10 win11 设置文件权限以解决Onedrive不能同步问题

初级代码游戏的专栏介绍与文章目录-CSDN博客 我的github&#xff1a;codetoys&#xff0c;所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。 这些代码大部分以Linux为目标但部分代码是纯C的&#xff0c;可以在任何平台上使用。 源码指引&#xff1a;github源…