OpenCompass 评测 InternLM-1.8B 实践

1. API评测

首先我们创建模型的配置文件,我们需要定义评测模型的类型,是OpenAISDK类型,然后是模型名称,请求地址和API等等内容。然后我们通过命令行python run.py --models puyu_api.py --datasets demo_cmmlu_chat_gen.py --debug即可一键评测对应的模型和数据集。

import os
from opencompass.models import OpenAISDKinternlm_url = 'https://internlm-chat.intern-ai.org.cn/puyu/api/v1/' # 你前面获得的 api 服务地址
internlm_api_key = os.getenv('INTERNLM_API_KEY')models = [dict(# abbr='internlm2.5-latest',type=OpenAISDK,path='internlm2.5-latest', # 请求服务时的 model name# 换成自己申请的APIkeykey=internlm_api_key, # API keyopenai_api_base=internlm_url, # 服务地址rpm_verbose=True, # 是否打印请求速率query_per_second=0.16, # 服务请求速率max_out_len=1024, # 最大输出长度max_seq_len=4096, # 最大输入长度temperature=0.01, # 生成温度batch_size=1, # 批处理大小retry=3, # 重试次数)
]

在这里插入图片描述
在这里插入图片描述

2. 本地评测

本地评测的model配置文件结构和API评测结构完全相同,但是参数有所不同。

from opencompass.models import HuggingFacewithChatTemplatemodels = [dict(type=HuggingFacewithChatTemplate,abbr='internlm2_5-1_8b-chat-hf',path='/share/new_models/Shanghai_AI_Laboratory/internlm2_5-1_8b-chat/',max_out_len=2048,batch_size=8,run_cfg=dict(num_gpus=1),)
]

模型配置文件结构完全相同,但是参数需要修改,type不再是SDK,而是HuggingFacewithChatTemplate,并且对应的路径也要修改成本机地址。一些与网络请求相关的参数也不再需要。我们可以通过命令行python run.py --datasets ceval_gen --models hf_internlm2_5_1_8b_chat --debug运行评测脚本。

我们也可以直接通过配置文件,指定模型和数据集:

from mmengine.config import read_basewith read_base():from .datasets.ceval.ceval_gen import ceval_datasetsfrom .models.hf_internlm.hf_internlm2_5_1_8b_chat import models as hf_internlm2_5_1_8b_chat_modelsdatasets = ceval_datasets
models = hf_internlm2_5_1_8b_chat_models

然后直接运行脚本即可,python run.py configs/eval_tutorial_demo.py --debug 。但是感觉还是用arg脚本更方便快捷。评测过程需要2~4小时,建议使用tmux来后台运行。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/13343.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

【算法】——二分查找合集

阿华代码,不是逆风,就是我疯 你们的点赞收藏是我前进最大的动力!! 希望本文内容能够帮助到你!! 目录 零:二分查找工具 1:最基础模版 2:mid落点问题 一:最…

Python 的 Pygame 库,编写简单的 Flappy Bird 游戏

Pygame 是一个用 Python 编写的开源游戏开发框架,专门用于编写 2D 游戏。它提供了丰富的工具和功能,使得开发者能够快速实现游戏中的图形渲染、声音播放、输入处理和动画效果等功能。Pygame 非常适合初学者和想要快速创建游戏原型的开发者。 Pygame 的主…

Ubuntu上搭建Flink Standalone集群

Ubuntu上搭建Flink Standalone集群 本文部分内容转自如下链接。 环境说明 ubuntu 22.06 先执行apt-get update更新环境 第1步 安装JDK 通过apt自动拉取 openjdk8 apt-get install openjdk-8-jdk执行java -version,如果能显示Java版本号,表示安装并…

【stablediffusion】ComfyUI | 恐怖如斯的放大模型DifFBIR,超分辨率放大、人脸修复、图像去噪 | 效果炸裂 | 强烈推荐

今天,我们将向您介绍一款令人兴奋的更新——Stable Diffusion的ComfyUI放大模型DifFBIR。这是一款基于Stable Diffusion技术的AI绘画工具,旨在为您提供一键式图像放大的便捷体验。无论您是AI绘画的新手还是专业人士,这个工具都能为您带来极大…

PCB设计基础

系列文章目录 文章目录 系列文章目录前言一、PCB设计术语与定义二、焊盘堆和过孔的构成及分类总结 前言 介绍PCB的基础内容。 一、PCB设计术语与定义 PCB全称为Printed Circuit Board,印刷电路板。它是电子元器件的支撑体,是重要的电子部件以及电气连接…

Node.js下载安装及环境配置教程

一、进入官网地址下载安装包 Node.js 中文网 选择对应你系统的Node.js版本,这里我选择的是Windows系统、64位 二、安装程序 (1)下载完成后,双击安装包,开始安装Node.js (2)直接点【Next】按钮,此处可根据…

深度学习知识点3-CBAM轻量的注意力模块

论文:(2018)包含空间注意力和通道注意力两部分1807.06521https://arxiv.org/pdf/1807.06521 通道注意力:对input feature maps每个feature map做全局平均池化和全局最大池化,得到两个1d向量,再经过conv&…

《云原生安全攻防》-- K8s安全防护思路

从本节课程开始,我们将正式进入防护篇。通过深入理解K8s提供的多种安全机制,从防守者的角度,运用K8s的安全最佳实践来保障K8s集群的安全。 在这个课程中,我们将学习以下内容: K8s安全防护思路:掌握K8s自身提…

MySQL技巧之跨服务器数据查询:基础篇-A数据库与B数据库查询合并

MySQL技巧之跨服务器数据查询:基础篇-A数据库与B数据库查询合并 上一篇已经描述:借用微软的SQL Server ODBC 即可实现MySQL跨服务器间的数据查询。 而且还介绍了如何获得一个在MS SQL Server 可以连接指定实例的MySQL数据库的链接名: MY_ODBC_MYSQL 以…

基于物联网的智能超市快速结算系统

摘 要 当今社会的商品层出不穷,人们因为越来越多大型仓储超市的出现使得生活更加便利,但许多随之而来的新问题也给人们带来了许多的不便,例如商家一直被更换标签不及时、货物丢失、超市内物品更换处理不及时、超市内人流高峰期人流控制不得…

JavaScript面向对象笔记(4)

一、正则表达式 1.正则表达式概述 Regular Expression:是用于匹配字符串组合的模式,再javaScript中,正则表达式也是对象。 正则表达式通常被用来检索、替换某个模式(规则)的文本。例如:表单校验&#xf…

20241112-Pycharm使用托管的Anaconda的Jupyter Notebook

Pycharm使用托管的Anaconda的Jupyter Notebook 要求 不要每次使用 Pycharm 运行 Jupyter 文件时都要手动打开 Anaconda 的 Jupyter Notebook 正文 pycharm中配置好会自动安装的,有的要自己配置 Pycharm中配置 文件 ——> 设置 ——> 语言和框架……&am…

vscode - 设置 Python 版本

在使用 vscode 编码 Python 时,选择合适的 Python 版本。 解决方法 使用快捷键 CtrlShiftP 打开命令窗口: 选择 “Python: Select Interpreter”,弹窗显示现有的 Python 版本: 回车选择需要的Python 版本即可。

【量化交易笔记】14.模拟盘效果

说明 距离上一篇的量化文章有一段时间,应小伙伴要求,继续写下去,我思考了一下,内容有很多,绝大多数是研究的过程,并且走的是弯路,分享了怕影响大伙,之前因为行情不好,研…

git rebase --continue解冲突操作

git rebase --continue解冲突操作 如果只是执行了 git rebase 命令,那么git会输出一下“错误”提示: There is no tracking information for the current branch. Please specify which branch you want to rebase against. See git-rebase(1) for detai…

nodejs express 框架使用

1. 准备环境 Nodejs 版本 v18.12.1, yarn 版本 1.22.21 2. 初始化项目 创建项目目录 express_demo01,进入目录,执行命令 npm init -y 生成 package.json 文件 圈起来的那一行修改为上图所示。使用 npm run dev 即可启动项目。 安装express 和 body-p…

Axure网络短剧APP端原型图,竖屏微剧视频模版40页

作品概况 页面数量:共 40 页 使用软件:Axure RP 9 及以上,非软件无源码 适用领域:短剧、微短剧、竖屏视频 作品特色 本作品为网络短剧APP的Axure原型设计图,定位属于免费短剧软件,类似红果短剧、河马剧场…

普通用户切换到 root 用户不需要输入密码配置(Ubuntu20)

在 Ubuntu 系统中,允许一个普通用户切换到 root 用户而不需要输入密码,可以通过以下步骤配置 sudo 设置来实现。 步骤: 打开 sudoers 文件进行编辑: 在终端中,输入以下命令来编辑 sudoers 文件: sudo visu…

程序设计方法与实践-变治法

变换之美 变治法就是基于变换的思路,进而使原问题的求解变得简单的一种技术。 变治法一般有三种类型: 实例化简:将问题变换为同问题,但换成更为简单、更易求解的实例。改变表现:变化为同实例的不同形式,…

11.12机器学习_特征工程

四 特征工程 1 特征工程概念 特征工程:就是对特征进行相关的处理 一般使用pandas来进行数据清洗和数据处理、使用sklearn来进行特征工程 特征工程是将任意数据(如文本或图像)转换为可用于机器学习的数字特征,比如:字典特征提取(特征离散化)、文本特征提取、图像特征提取。 …