当前位置：首页 > news >正文

YOLO目标检测之模型剪枝

news 2025/4/30 14:25:51

最近，博主有一个需求，需要将模型部署到一个边缘设备，此时，便遇到了一个问题，YOLO模型太大，无法部署，此时，我们除了采用量化的操作以外，就需要使用剪枝操作了。

约束训练

约束训练是为了筛选哪些channel比较重要，哪些channel没有那么重要，约束训练可以使得模型更易于剪枝。在约束训练中，模型会学习到一些通道或者权重系数比较不重要的信息，而这些信息在剪枝过程中得到应用，从而达到模型压缩的效果。而如果直接进行剪枝操作，可能会出现一些问题，比如剪枝后的模型精度大幅下降、剪枝不均匀等。因此，在进行剪枝操作之前，通过稀疏训练的方式，可以更好地准确地确定哪些通道或者权重系数可以被剪掉，从而避免上述问题的发生。

首先，在ultralytics/yolo/engine/trainer.py添加如下代码

# Backward
self.scaler.scale(self.loss).backward()
# ========== 新增代码 ==========
l1_lambda = 1e-2 * (1 - 0.9 * epoch / self.epochs)
for k, m in self.model.named_modules():if isinstance(m, nn.BatchNorm2d):m.weight.grad.data.add_(l1_lambda * torch.sign(m.weight.data))#动态调整正则化强度，这种设计的目的是让正则化在训练初期较强，而在训练后期逐渐减弱，从而避免过度正则化影响模型的最终性能m.bias.grad.data.add_(1e-2 * torch.sign(m.bias.data)) #对偏置施加 L1 正则化
# ========== 新增代码 ==========# Optimize - https://pytorch.org/docs/master/notes/amp_examples.html
if ni - last_opt_step >= self.accumulate:self.optimizer_step()last_opt_step = ni

L1 正则化增强了 BatchNorm2d 层的稀疏性，并通过动态调整正则化强度实现了更好的训练效果，用于模型压缩，防止过拟合。
然后重新训练模型，注意，要加上 amp=False 参数，表示禁用自动混合精度，所有计算使用 FP32。同理，amp=True 表示启用自动混合精度，部分计算使用 FP16，从而加速训练并减少显存占用。当然，这其实是方便我们后续的模型剪枝操作。

from ultralytics import YOLO
model=YOLO("yolov8-obb.yaml").load("yolov8n.pt")
results = model.train(data="tower-seg.yaml", epochs=300,amp=False, imgsz=640)

在这里插入图片描述
原效果：

在这里插入图片描述

采用约束训练后效果：

在这里插入图片描述

剪枝

在剪枝时，我们选择加载last.pt而非best.pt，因为由于迁移学习，模型的泛化性比较好，在第一个epoch时mAP值最大，但这并不是真实的，我们需要稳定下来的一个模型进行prune

from ultralytics import YOLO
import torch
from ultralytics.nn.modules import Bottleneck, Conv, C2f, SPPF, Detect# 加载预训练模型
yolo = YOLO("D:/project_mine/detection/ultralytics/runs/obb/train3/weights/last.pt")
model = yolo.model# 1. 计算 BatchNorm 中 gamma 的阈值
ws = []for _, m in model.named_modules():if isinstance(m, torch.nn.BatchNorm2d):w = m.weight.abs().detach()  # 使用 gamma 的绝对值作为重要性指标ws.append(w)factor = 0.7  # 保留 80% 的通道
ws = torch.cat(ws)
threshold = torch.sort(ws, descending=True)[0][int(len(ws) * factor)]
print(f"Threshold for pruning: {threshold}")# 2. 定义结构化剪枝函数
def _prune(c1, c2):"""c1: 当前卷积模块（包含 Conv 和 BatchNorm）c2: 下一个卷积模块（可能是 Conv、C2f 或其他类型）"""bn = c1.bnconv = c1.conv# 获取当前 BatchNorm 的 gamma 值gamma = bn.weight.data.detach()mask = torch.where(gamma.abs() >= threshold)[0]  # 筛选出需要保留的通道索引# 更新 BatchNorm 参数bn.weight.data = bn.weight.data[mask]bn.bias.data = bn.bias.data[mask]bn.running_mean.data = bn.running_mean.data[mask]bn.running_var.data = bn.running_var.data[mask]bn.num_features = len(mask)# 更新当前卷积层的参数conv.weight.data = conv.weight.data[mask]  # 保留对应的滤波器conv.out_channels = len(mask)if conv.bias is not None:conv.bias.data = conv.bias.data[mask]# 更新下一个卷积层的输入通道数if not isinstance(c2, list):c2 = [c2]  # 将 c2 包装成列表for item in c2:if item is not None:if isinstance(item, Conv):next_conv = item.convelse:next_conv = itemnext_conv.in_channels = len(mask)next_conv.weight.data = next_conv.weight.data[:, mask]  # 保留对应的输入通道# 3. 遍历模型进行剪枝
def prune(m1, m2):if isinstance(m1, C2f):m1 = m1.cv2# 确保 m2 是一个列表if not isinstance(m2, list):m2 = [m2]for i, item in enumerate(m2):if isinstance(item, C2f) or isinstance(item, SPPF):m2[i] = item.cv1_prune(m1, m2)# 对 Bottleneck 模块进行剪枝
for _, m in model.named_modules():if isinstance(m, Bottleneck):prune(m.cv1, m.cv2)# 4. 设置模型参数为可训练状态
for _, p in yolo.model.named_parameters():p.requires_grad = True# 5. 导出剪枝后的模型
yolo.export(format="onnx")  # 导出为 ONNX 文件
torch.save(yolo.ckpt, "pruned_model.pt")  # 保存剪枝后的模型
print("Pruning completed and model saved!")

使用https://netron.app/查看一下模型结构：发现里面出现了这种不规则的单数结构，这就说明我们的剪枝成功了。

在这里插入图片描述

回调训练

首先，把之前在trainer.py中加的代码注释掉，然后依旧在yolo/engine/trainer.py代码中的def setup_model方法中添加如下内容

self.model = self.get_model(cfg=cfg, weights=weights, verbose=RANK == -1)  # calls Model(cfg, weights)
# ========== 新增该行代码 ==========
self.model = weights
# ========== 新增该行代码 ==========
return ckpt

修改完成后，开启回调训练：

from ultralytics import YOLO
model=YOLO("yolov8-obb.yaml").load("prune.pt")
results = model.train(data="tower-seg.yaml", epochs=300,imgsz=640)

原始结果：

在这里插入图片描述

剪枝后结果：

在这里插入图片描述

可以看到，这种剪枝后的精度下降还是较为明显的，不够对于我的任务足够了

至此，我们的模型剪枝操作便完成了。

查看全文

http://www.xdnf.cn/news/171541.html

Go RPC 服务方法签名的要求

有关爬虫中数据库的封装——单线程爬虫

Tauri窗口与界面管理：打造专业桌面应用体验 (入门系列五)

【Fifty Project - D18】

多节管件连接套总成弯扭复合旋转疲劳试验系统

PostSwigger Web 安全学习：CSRF漏洞2

现代多核调度器的本质调度三重奏

Github 热点项目 rowboat 一句话生成多AI智能体！5分钟搭建企业级智能工作流系统

在 Cursor 中配置 GitHub MCP Server

基于ArcGIS的洪水灾害普查、风险评估及淹没制图技术研究

docker(3) -- 图形界面

ReACT Agent 实战

面试：结构体默认是对齐的嘛？如何禁止对齐？

遥控器信号传输与信号灯指示要点！

解决新搭建的centos虚拟器，yum下载不了的问题

【音视频】SDL窗口显示

DIFY教程第一集：安装Dify配置环境

广度优先搜索（BFS）算法详解

23种设计模式-行为型模式之命令模式（Java版本）

鸿蒙系统应用开发全栈指南

HarmonyOS Next～鸿蒙系统流畅性技术解析：预加载与原生架构的协同进化

神经编译革命：如何用脑机接口直接编程量子计算机？

用Function Calling让GPT查询数据库（含示例）

【Git】初始Git及入门命令行

03.使用spring-ai玩转MCP

IdeaVim 配置与使用指南

【Part 2安卓原生360°VR播放器开发实战】第二节｜基于等距圆柱投影方式实现全景视频渲染

位置差在坐标系间的相互转换

C++类和对象(上)

YOLO目标检测之模型剪枝

相关介绍

1. 训练基础模型

2. 确定剪枝策略

3. 权重重要性评估

4. 实施剪枝

5. 微调（Fine-tuning）

6. 验证与迭代

约束训练

剪枝

回调训练

相关文章：