GPU性能测试,环境搭建笔记,transformers/huggingface_hub改国内源,BertLayer import 报错

代码,以及测试方案使用的是沐神的代码
github的代码:

1. 环境搭建

首先是安装torch

这是我的pytorch版本

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124

使用pip指令安装transformers
transformers 这个包是一个预训练好的模型的大全集,可以从里面下载各种训练好的模型。

pip install transformers 

安装好后发现连不上Hugging face
先安装 huggingface_hub

 pip install -U huggingface_hub

安装完成后在代码中运行,下面的代码,就可以切换到国内的源,下载模型

import os
os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'

除此以外,还有一种办法可以一劳永逸的改
在虚拟环境的 “…/huggingface_hub”中找到:constants.py文件

# 将原来的默认网址修改为镜像网址
# _HF_DEFAULT_ENDPOINT = "https://huggingface.co"
_HF_DEFAULT_ENDPOINT = "https://hf-mirror.com"

张量测试结果

4090D 显卡测试结果,可以看到在float32的时候,4090 没有比3090TI好太多。
float 16 可以看到有,明显的提升,感觉后面可以尽量16的方式去算,会更加能体现出优势
在这里插入图片描述
3090TI的算力结果
在这里插入图片描述

这个是官方公布的算力,从自测的值和官方的值相比,FP16算力小了一半。

ModelMemory (GB)Memory Bandwidth (GB/sec)FP32 TFLOPSFP16 TFLOPS
A10080203919.5312
V1001690015.7125
A60004876838150
RTX 3090 TI24100840160

BERT不同batch size

3090TI,显卡的参数
在这里插入图片描述
4090D 显卡的参数
在这里插入图片描述

在大的batch size下整体有较大的提升,小batch size 反而效率降低了。是否为核心加多,核心的调度增加了额外开销,单个核心反而不如之前的了。

遇到的问题

BertLayer import 报错

不知道沐神用的哪个版本的transformers ,但是我发现我装的最新版本的没有这个,但在文件中还有这个函数。所以需要自己添加一下申明,应该就可以使用了。

在__init__.py 这个文件中有两处需要修改,添加完成后,就可以在代码中引用这些部分了

  1. 在1544行附近,添加BertLayer 这个部分。
  2. 在6433行的位置,添加BertLayer 这个部分。在这里插入图片描述在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/12728.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

PR剪辑视频去重消重色彩叠加特效模板

采用现代设计,灵感来自鲜艳的色彩和动态的灯光效果。包含颜色控制选项,能够轻松地调整效果以匹配您的视频风格。具有图像和视频替换功能。 易用性:适合所有经验水平的用户,包括初学者。 调色板自定义:完全控制颜色以匹…

采购管理软件选择攻略:别忽视这些注意事项

企业在选择采购管理软件时必须谨慎,因为这直接关系到简化采购流程、成本控制、风险降低和效率提升等多个方面。面对内众多的软件选项和竞争目标,采购团队可能难以做出正确的选择。别担心,本文将提供一些建议和注意事项。 采购管理软件的重要性…

关于 npm 更新镜像源问题

npm(Node Package Manager),是一个NodeJS包管理和分发工具,已经成为了非官方的发布Node模块(包)的标准。) 查看当前npm版本 npm -v 10.9.0 执行以下命令报错 npm install --registryhttp…

【OceanBase 诊断调优】—— OceanBase 数据库统计信息被禁用,状态为 broken 的原因和解决方法

问题现象 因为人为因素导致部分统计信息函数未安装,自动统计信息触发执行长期失败。重新安装统计信息相关函数后,发现仍然无法正常自动统计信息收集,统计信息状态为 broken。 问题原因 统计信息 JOB 收集失败次数达到 16 次会直接禁用 JOB …

2024腾讯云双十一必抢清单:省钱、省心、省力的购买攻略

一、前言 大家好,我是 Neo!一年一度的双十一购物狂欢节又到了!在这个特别的日子,腾讯云也推出了超值的优惠活动。最近我正好在做自己的小程序项目,需要用到服务器,特意关注了这次活动,看看有没…

业财税深度融合,金鹰国际集团以数字化打造硬实力

数字经济时代,企业数字化转型已成必然,越来越多的企业踏浪前行,加速探索全领域的数字化转型,获得竞争优势。数字化技术的快速发展也加速了税收征管改革进程,财务数字化成为企业转型升级的有力抓手,助力优化…

Spring Boot 多环境开发配置详解:Profiles 的使用指南

目录 前言1. Profiles 简介1.1 什么是 Profiles?1.2 Profiles 的应用场景 2. 单文件配置方式2.1 使用三横杠 --- 分隔配置2.2 指定哪个环境的配置生效 3. 多文件配置方式3.1 配置文件的创建与命名3.2 多文件配置的优点 4. Profiles 分组管理4.1 Profile 分组的配置4…

emp.dll文件丢失的几种方法-常见问题

emp.dll文件在Windows系统中扮演着重要的角色,其作用不仅限于单一的应用程序或游戏。以下是emp.dll在系统中的几种作用: 图形渲染与游戏支持:emp.dll可能集成了高效的渲染引擎,支持复杂的3D图形和动画,为玩家提供沉浸…

永久免费!星火大模型接口源码分享(支持上下文、连续对话和历史对话保存)

文章目录 📖 介绍 📖🏡 演示环境 🏡📒 星火大模型 📒🌟 接口功能📜 源码分享🎯 使用方法⚓️ 相关链接 ⚓️📖 介绍 📖 你是否在寻找一款国产的、永久免费的大模型接口?想要在自己的项目中轻松集成强大的自然语言处理能力?今天,将为你分享一份免费的星…

小型内衣洗衣机哪个牌子好?五大超值优等品速来围观!

小型洗衣机的存在无疑是懒人的福音,它帮助了许多忙碌的人们解决了洗衣烦恼。尤其对于年龄较小的婴幼儿需要勤换衣、洗衣的时候,它的功能就显得尤为重要了,同时还能够用于清洗大人的内衣裤、袜子这一系列的贴身衣物。小型洗衣机通常用于宿舍、…

取代产品岗,又一新兴岗位在崛起!这才是产品经理未来5年最好的就业方向!

这是我入行产品经理的第1007天: 每天都是整理需求、开会、写文档、协调资源 被开发、运营diss一通,顺便为产品“背个锅” 熬夜加班做出来的产品,业务团队还是不愿意用…… 更让人头秃的是,干了3年,好像到了“职…

打造自己的RAG解析大模型:(可商用)智能文档服务上线部署

通用版面分析介绍 版面解析是一种将文档图像转化为机器可读数据格式的技术,广泛应用于文档管理和信息提取等领域。通过结合OCR、图像处理和机器学习,版面解析能够识别文档中的文本块、图片、表格等版面元素,最终生成结构化数据,大…

Spring

1、Spring框架中单例bean是线程安全的吗? 不是线程安全的。当多用户同时请求一个服务时,容器会给每个请求分配一个线程,这些线程会并发执行业务逻辑。如果处理逻辑中包含对单例状态的修改,比如修改单例的成员属性,就必…

MathGPT的原理介绍,在中小学数学教学的应用场景,以及代码样例实现

大家好,我是微学AI,今天给大家介绍一下MathGPT的原理介绍,在中小学数学教学的应用场景,以及代码样例实现。MathGPT的核心架构是一个精心设计的多层次系统,旨在有效处理复杂的数学问题。其主要组成部分包括 数学知识图谱…

【Linux】man 手册的使用指南

man 手册的使用指南 man手册中文版上传至资源(用心整理,感谢理解!) man手册官方下载链接:https://mirrors.edge.kernel.org/pub/linux/docs/man-pages/ man 手册页:https://linux.die.net/man/ Linux man…

机器学习分析scRNA-seq解析急性髓系白血病中的疾病和免疫过程

急性髓性白血病(AML,Acute myeloid leukemia)是一种存在于复杂微环境中的疾病。作者基于scRNA-seq分析了来自40例骨髓抽吸donor的38,410个细胞,包括16例AML患者和5例健康donor。然后,应用机器学习分类器来区分恶性细胞…

【缓存策略】你知道 Write Back(回写)这个缓存策略吗?

👉博主介绍: 博主从事应用安全和大数据领域,有8年研发经验,5年面试官经验,Java技术专家,WEB架构师,阿里云专家博主,华为云云享专家,51CTO 专家博主 ⛪️ 个人社区&#x…

1小时构建Vue3知识体系-Vue的响应式,让数据动起来

本文转载自:https://fangcaicoding.cn/course/12/62 大家好!我是方才,目前是8人后端研发团队的负责人,拥有6年后端经验&3年团队管理经验。 系统学习践行者!近期在系统化输出前端入门相关技术文章,期望能…

Docker网络详解

安装Docker时,它会自动创建三个网络,bridge(创建容器默认连接到此网络)、 none 、host 网络模式简介Host容器将不会虚拟出自己的网卡,配置自己的IP等,而是使用宿主机的IP和端口。Bridge此模式会为每一个容…

宝塔面板部署前端项目(包含ssl证书部署)

环境: ①nginx(这里使用的版本为1.21.41) ②前端项目文件(以根目录打包的文件) ③域名 ④SLL数字证书的key文件和.pem文件(我们这里用的是nginx部署,因此下载证书的时候,下载nginx对…