大模型微调概览

大模型微调概览

news/2024/9/23 3:15:44/文章来源:https://blog.csdn.net/lovechris00/article/details/133530253

文章目录

- 微调和高效微调
- 高效微调技术方法概述
- 高效微调方法一：LoRA
- 高效微调方法二: Prefix Tuning
- 高效微调方法三: Prompt Tuning
- 高效微调方法四: P-Tuning v2
- 基于强化学习的进阶微调方法
- - RLHF 训练流程

微调和高效微调

微调，Fine-Tuning，一般指全参数的微调(全量微调)，指是一类较早诞生的微调方法，全参数微调需要消耗大量的算力，实际使用起来并不方便，因此不久之后又诞生了只围绕部分参数进行微调的高效微调方法;
高效微调，State-of-the -art Parameter- Efficient Fine-Tuning (SOTA PEFT),特指部分参数的微调方法，这种方法算力功耗比更高，也是目前最为常见的微调方法;
除此之外，Fine-Tuning也可以代指全部微调方法，同时OpenAI中模型微调API的名称也是 Fine-Tuning
需要注意的是，OpenAl提供的在线微调方法也是一种高效微调方法，并不是全量微调;

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.xdnf.cn/news/147894.html

如若内容造成侵权/违法违规/事实不符，请联系一条长河网进行投诉反馈，一经查实，立即删除！

相关文章

openGauss学习笔记-88 openGauss 数据库管理-内存优化表MOT管理-内存表特性-使用MOT-MOT使用将磁盘表转换为MOT

openGauss学习笔记-88 openGauss 数据库管理-内存优化表MOT管理-内存表特性-使用MOT-MOT使用将磁盘表转换为MOT

文章目录 openGauss学习笔记-88 openGauss 数据库管理-内存优化表MOT管理-内存表特性-使用MOT-MOT使用将磁盘表转换为MOT88.1 前置条件检查88.2 转换88.3 转换示例 openGauss学习笔记-88 openGauss 数据库管理-内存优化表MOT管理-内存表特性-使用MOT-MOT使用将磁盘表转换为MOT …

阅读更多...

【数据结构】排序(2)—冒泡排序快速排序

【数据结构】排序(2)—冒泡排序快速排序

目录一. 冒泡排序基本思想代码实现时间和空间复杂度稳定性二. 快速排序基本思想代码实现 hoare法挖坑法前后指针法时间和空间复杂度稳定性一. 冒泡排序基本思想冒泡排序是一种交换排序。两两比较数组元素，如果是逆序(即排列顺序与排序后…

阅读更多...

HTML详细基础（二）文件路径

HTML详细基础（二）文件路径

目录一.相对路径二.绝对路径三.超链接标签四.锚点链接首先，扩展一些HTML执行的原理： htmL(hypertext markup Language) 是一种规范（或者说是一种标准），它通过标记符（tag）来标记要显示…

阅读更多...

求各区域热门商品Top3 - HiveSQL

求各区域热门商品Top3 - HiveSQL

背景：这是尚硅谷SparkSQL练习题，本文用HiveSQL进行了实现。数据集：用户点击表，商品表，城市表题目: ① 求每个地区点击量前三的商品； ② 在①的基础上，求出每个地区点击量前三的商品后&a…

阅读更多...

【管理运筹学】第 8 章 | 动态规划（5，设备更新问题）

【管理运筹学】第 8 章 | 动态规划（5，设备更新问题）

系列文章【管理运筹学】第 8 章 | 动态规划（1，多阶段决策过程与动态规划基本概念） 【管理运筹学】第 8 章 | 动态规划（2，动态规划的基本思想与模型求解） 【管理运筹学】第 8 章 | 动态规划（3&…

阅读更多...

MySQL进阶 —— 超详细操作演示！！！（下）

MySQL进阶 —— 超详细操作演示！！！（下）

MySQL进阶 —— 超详细操作演示！！！（下） 五、锁5.1 概述5.2 全局锁5.3 表级锁5.4 行级锁六、InnoDB 引擎6.1 逻辑存储结构6.2 架构6.3 事务原理6.4 MVCC 七、MySQL 管理7.1 系统数据库7.2 常用工具 MySQL— 基础语法大…

阅读更多...

基于蜉蝣优化的BP神经网络（分类应用） - 附代码

基于蜉蝣优化的BP神经网络（分类应用） - 附代码

基于蜉蝣优化的BP神经网络（分类应用） - 附代码文章目录基于蜉蝣优化的BP神经网络（分类应用） - 附代码1.鸢尾花iris数据介绍2.数据集整理3.蜉蝣优化BP神经网络3.1 BP神经网络参数设置3.2 蜉蝣算法应用 4.测试结果：5.M…

阅读更多...

【C++】设计模式之——建造者

【C++】设计模式之——建造者

建造者模式概念模拟实现建造者模式代码实现建造者模式首先先大体了解一下，建造者模式是什么意思，它是怎么实现的？ 首先，建造者模式是一种创建型设计模式再一个它是使用多个简单的对象一步一步的搭建出一个复杂的对象它可以将一个…

阅读更多...

基于蚁狮优化的BP神经网络（分类应用） - 附代码

基于蚁狮优化的BP神经网络（分类应用） - 附代码

基于蚁狮优化的BP神经网络（分类应用） - 附代码文章目录基于蚁狮优化的BP神经网络（分类应用） - 附代码1.鸢尾花iris数据介绍2.数据集整理3.蚁狮优化BP神经网络3.1 BP神经网络参数设置3.2 蚁狮算法应用 4.测试结果：5.M…

阅读更多...

第81步时间序列建模实战：Adaboost回归建模

第81步时间序列建模实战：Adaboost回归建模

基于WIN10的64位系统演示一、写在前面这一期，我们介绍AdaBoost回归。同样，这里使用这个数据： 《PLoS One》2015年一篇题目为《Comparison of Two Hybrid Models for Forecasting the Incidence of Hemorrhagic Fever with Renal Syndr…

阅读更多...

react create-react-app 配置less

react create-react-app 配置less

环境信息： create-react-app:v5 react:18.2.0 node:18.16.0 如果你不必须使用 less 建议直接使用scss。因为less配置会遇到很多问题。配置less过程： 如果你只需要 sass的话，就可以直接使用sass。因为默认配置了scss。 npm、yarn、cnpm、…

阅读更多...

【算法训练-二分查找一】二分查找、在排序数组中查找元素的第一个和最后一个位置

【算法训练-二分查找一】二分查找、在排序数组中查找元素的第一个和最后一个位置

废话不多说，喊一句号子鼓励自己：程序员永不失业，程序员走向架构！本篇Blog的主题是螺旋矩阵，使用【二维数组】这个基本的数据结构来实现二分查找【EASY】从最简单的二分查找入手，进而开始解决一系列其变体…

阅读更多...

【C语言】【动态内存管理】malloc,free,calloc,realloc

【C语言】【动态内存管理】malloc,free,calloc,realloc

1.malloc函数 void* malloc(size_t size)功能：向内存申请字节为 size大小的空间使用时要包含头文件：<stdlib.h> 开辟成功：返回开辟好的空间初始地址的指针开辟失败：返回空指针 NULL 使用举例： (malloc和free…

阅读更多...

你写过的最蠢的代码是？——后端篇

你写过的最蠢的代码是？——后端篇

🌷🍁 博主猫头虎（🐅🐾）带您 Go to New World✨🍁 🦄 博客首页: 🐅🐾猫头虎的博客🎐《面试题大全专栏》 🦕 文章图文并茂&#x1f996…

阅读更多...

k8s全栈-笔记6-Prometheus+Alertmanager构建监控系统

k8s全栈-笔记6-Prometheus+Alertmanager构建监控系统

k8s全栈-笔记6-PrometheusAlertmanager构建监控系统实验环境: Pormetheusgrafanaalertmanager安装在k8s集群,k8s环境如下 K8S集群角色IP主机名安装的组件控制节点(master)172.20.252.181k8s-master01apiserver,controller-manager,schedule,kubelet,etcd,kube-proxy,容器运…

阅读更多...

国庆中秋特辑（六）大学生常见30道宝藏编程面试题

国庆中秋特辑（六）大学生常见30道宝藏编程面试题

以下是 30 道大学生 Java 面试常见编程面试题和答案，包含完整代码： 什么是 Java 中的 main 方法？ 答：main 方法是 Java 程序的入口点。它是一个特殊的方法，不需要被声明。当 Java 运行时系统执行一个 Java 程序时&…

阅读更多...

安全基础 --- MySQL数据库的《锁》解析

安全基础 --- MySQL数据库的《锁》解析

MySQL的ACID （1）ACID是衡量事务的四个特性原子性（Atomicity，或称不可分割性）一致性（Consistency）隔离性（Isolation）持久性（Durability） &…

阅读更多...

Python学习笔记之运算符的使用

Python学习笔记之运算符的使用

Python学习笔记之运算符的使用整型：二进制0b100十进制4、八进制0o100十进制64、十进制100、十六进制0x100十进制256浮点型：123.456，1.23456e2字符串型：‘Hello’，“Hello”布尔型：True、False复数型&…

阅读更多...

Postgresql源码（114）视图权限授予逻辑

Postgresql源码（114）视图权限授予逻辑

0 速查被授权的对象在系统表中记录授权信息，例如pg_namespace中的nspacl列： {mingjieUC/mingjie,UC/mingjie,pusr1UC/mingjie}pusr1UC/mingjie的含义： mingjie是赋予者pusr1是被赋予者UC是权限，表示USAGE和CREATE 1 视图权限…

阅读更多...

PHP 反序列化漏洞：身份标识

PHP 反序列化漏洞：身份标识

文章目录参考环境访问修饰符访问修饰符PHP 与访问修饰符手写身份标识身份标识定义身份标识控制字符 NUL在 PHP 中如何表示空字符？ 通过空字符尝试构建包含非公共属性对象的序列化文本空字符的传输控制字符的不可打印性结论另辟蹊径URL 字符编码将非 ASCII 字符文…

阅读更多...

最新文章