一文学会编写大模型备案安全评估报告「小白也可学会」

 

文章目录

一、语料安全评估

        (一) 评估内容

        (二) 评估结论

二、模型安全评估

三、安全措施评估

四、总体结论

适用于不会大模型备案过程中对大模型备案安全评估报告不会如何编写的业务人员。

*图:大模型备案全套素材文件

一、语料安全评估

(一) 评估内容

  1. 文本训练语料规模

    • 训练语料存储规模:详细说明训练语料按文本格式存储时的总容量。
    • 训练语料数量:统计训练语料中词元(Token)的总数,确保语料的丰富性和多样性。
  2. 各类型语料规模

    • 中文文本、英文文本、代码、图片、音频、视频及其他语料:分类统计各类语料的规模,以确保模型训练的全面性。
  3. 训练语料来源

    • 开源语料、自采语料、商业语料:分析语料来源的组成,确保来源的合法性和多样性。
    • 境外开源网站语料:详细统计境外开源网站提供的各类语料规模。
    • 自采语料:统计企业自行采集的各类语料规模。
    • 商业语料:统计购买的商业语料规模。
  4. 语料标注数量

    • 标注数量:统计文本和图片的标注数量,按标注单元计数。
  5. 标注人员情况

    • 人员数量和类型:统计标注人员的数量和类型,包括内部员工和外包人员。
    • 培训情况:记录标注人员的培训时间、培训数量等,确保标注质量。
  6. 标注规则

    • 规则制定:根据《生成式人工智能服务管理暂行办法》第四条要求,制定详细的标注规则。
  7. 标注内容准确性核验

    • 人工核验比例:统计标注内容准确性的人工核验比例,确保标注的准确性。
  8. 语料合法性

    • 来源合法性:评估语料来源的合法性,确保所有语料均来自合法渠道。
    • 知识产权内容:检查语料中是否含有侵害他人知识产权的内容。
    • 个人信息内容:确保语料中不包含违法违规的个人信息内容。

(二) 评估结论

  1. 合规性评估:判断语料是否符合《生成式人工智能服务管理暂行办法》的相关规定,是否含有违反我国法律法规的内容。
  2. 个人信息评估:统计包含个人信息的语料数量和种类,评估是否符合规定。
  3. 知识产权风险分析:分析因语料产生知识产权纠纷的风险。
  4. 安全风险防范建议:提出防范语料安全风险的措施和建议。

二、模型安全评估

  1. 语料内容评估

    • 人工抽检:说明抽检数量与合格率。
    • 关键词抽检:说明抽检数量与合格率。
    • 分类模型抽检:说明抽检数量与合格率。
  2. 生成内容评估

    • 人工抽检:说明抽检数量与合格率。
    • 关键词抽检:说明抽检数量与合格率。
    • 分类模型抽检:说明抽检数量与合格率。
  3. 涉知识产权、商业秘密的评估

    • 评估方法:详细说明评估方法。
    • 评判标准:列出评判标准。
    • 评估结果:展示评估结果。
  4. 涉民族、信仰、性别等的评估

    • 评估方法:详细说明评估方法。
    • 评判标准:列出评判标准。
    • 评估结果:展示评估结果。
  5. 涉透明性、准确性、可靠性等的评估

    • 评估方法:详细说明评估方法。
    • 评判标准:列出评判标准。
    • 评估结果:展示评估结果。

三、安全措施评估

  1. 模型适用人群、场合、用途

    • 适用人群:明确服务的适用人群,包括未成年人、学生等。
    • 适用场合:明确适用场合,如关键信息基础设施、自动控制、医疗信息服务、心理咨询等。
    • 服务范围:说明服务范围是否限定或未限定特定领域。
  2. 服务过程中收集保存个人信息情况

    • 个人信息类型、数量、用途及保存期限:详细说明服务过程中收集保存的个人信息情况。
  3. 收集个人信息征得个人同意情况

    • 同意方式:说明收集个人信息征得个人同意的方式。
  4. 受理处理使用者请求的情况

    • 条件及途径方法:详细说明受理处理使用者查阅、复制、更正、补充、删除个人信息请求的条件和途径方法。
  5. 图片、视频标识情况

    • 标识样式:描述标识的样式。
    • 位置:说明标识在图片、视频中的具体位置。
    • 频度:描述标识的频度,如每帧、跳帧等。
  6. 接受公众或使用者投诉举报情况

    • 途径及反馈方式:说明接受公众或使用者投诉举报的途径及反馈方式。
  7. 服务协议情况

    • 协议内容:确认上述1至6内容是否已经写入模型服务协议。
  8. 非法内容拦截措施

    • 监看人员数量:统计监看人员的数量。
    • 预置关键词拦截:提供预置关键词拦截列表。
    • 分类模型检测:说明分类模型研制情况和准确性。
  9. 拒答率

    • 拒答数量比率:统计拒绝回答或者以简单模板回答的数量占总测试数量的比率。
  10. 模型更新、升级

    • 重新预训练情况:说明在何种情况下重新进行预训练,如较频繁发现生成非法内容。
    • 所需时间:统计重新预训练所需的时间。
    • 优化训练频度及时间:计划优化训练(fine-tuning)的频度及所需时间。

四、总体结论

  1. 合规性评估:判断是否符合《生成式人工智能服务管理暂行办法》的相关规定。
  2. 主要风险:总结语料、模型、安全措施等方面存在的主要风险。
  3. 安全风险预判及防范措施建议:预判模型上线提供服务后的主要安全风险,并提出防范措施建议。
  4. 处置能力评估:评估如果模型上线提供服务后对用户和社会造成损害,服务提供者是否具备相应处置能力。
  5. 服务上线建议:根据评估结果,提出是否建议上线提供服务的建议。

———————————————————————————————————————————

五、了解更多:cybtec

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/8330.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

Pytest参数详解 — 基于命令行模式!

1、--collect-only 查看在给定的配置下哪些测试用例会被执行 2、-k 使用表达式来指定希望运行的测试用例。如果测试名是唯一的或者多个测试名的前缀或者后缀相同,可以使用表达式来快速定位,例如: 命令行-k参数.png 3、-m 标记&#xff08…

SpringBoot项目集成ONLYOFFICE

ONLYOFFICE 文档8.2版本已发布:PDF 协作编辑、改进界面、性能优化、表格中的 RTL 支持等更新 文章目录 前言ONLYOFFICE 产品简介功能与特点Spring Boot 项目中集成 OnlyOffice1. 环境准备2. 部署OnlyOffice Document Server3. 配置Spring Boot项目4. 实现文档编辑功…

STL之string的使用(超详解)

目录 1. C/C中的字符串 1.1. C语言中的字符串 1.2. C中的字符串 2. string的接口 2.1. string的迭代器 2.1.1begin()与end()函数 2.2.2 rbegin()与rend()函数 2.2. string的初始化与销毁 2.3. string的容量操作 2.3.1 size(),length(),capa…

《JavaEE进阶》----20.<基于Spring图书管理系统(登录+添加图书)>

PS:关于接口定义 接口定义,通常由服务器提供方来定义。 1.路径:自己定义 2.参数:根据需求考虑,我们这个接口功能完成需要哪些信息。 3.返回结果:考虑我们能为对方提供什么。站在对方角度考虑。 我们使用到的…

Sigrity Power SI 3D-EM Full Wave Extraction模式如何进行S参数提取和观测3D电磁场和远场操作指导(一)

Sigrity Power SI 3D-EM Full Wave Extraction模式如何进行S参数提取和观测3D电磁场和远场操作指导(一) Sigrity Power SI的3D-EM Full Wave Extraction模式是Power SI的3D全波提取工具,相比于2D提取,3D全波提取的结果更为精确,且支持设置跨平面的port,也就是lump port,这…

用Python打造你的《天天酷跑》——从零开始的游戏开发之旅

前言 在快节奏的生活里,偶尔玩一款轻松有趣的小游戏可以很好地放松心情。《天天酷跑》作为一款经典的跑酷游戏,凭借其简单易上手的操作和丰富多彩的关卡设计,深受广大玩家的喜爱。如果你对游戏开发感兴趣,或者想要尝试自己动手制…

泷羽sec学习打卡-shodan扫描4

声明 学习视频来自B站UP主 泷羽sec,如涉及侵权马上删除文章 笔记的只是方便各位师傅学习知识,以下网站只涉及学习内容,其他的都与本人无关,切莫逾越法律红线,否则后果自负 关于shodan的那些事儿-4 一、shodan4如何查看公网ip?如何查看自己的ip?如何查看出…

深层次识别:书脊图像分割

书脊图像分割系统源码&数据集分享 [yolov8-seg-C2f-DAttention&yolov8-seg-EfficientHead等50全套改进创新点发刊_一键训练教程_Web前端展示] 1.研究背景与意义 项目参考ILSVRC ImageNet Large Scale Visual Recognition Challenge 项目来源AAAI Glo…

已有商标证的人注意,留存使用证据!

近日有个网友联系普推知产商标老杨,说商标被撤三已经答辩了一次,但是没有成功,无法证明在指定服务上使用,原商标注册证被作废。 现在好的商标资源有限,在许多申请注册时会通过撤三打掉在先权利,即连续三年不…

Oracle视频基础1.3.7练习

1.3.7 看oracle是否启动构造一个pfile:boobooke.ora看spfilewilson内容修改alert log file里拷贝的参数内容,创建一个pfile boobooke.ora用新创建的pfile启动数据库,并创建新的spfile:spfilebbk.ora启动数据库,监听,看新的进程解…

深度强化学习:从理论到应用

目录 1.引言 2.什么是强化学习? 3.深度学习和强化学习的结合 4.深度强化学习的主要方法 5.深度强化学习的应用领域 6.深度强化学习的挑战与未来 7.总结 1.引言 深度强化学习(Deep Reinforcement Learning,DRL)是近年来人工…

如何在算家云搭建Hunyuan-DiT(图像生成)

一、Hunyuan-DiT简介 Hunyuan-DiT 是由腾讯混元推出的文生图扩散模型,支持中文和英文双语输入,其他开源模型相比,Hunyuan-DiT 在中文到图像生成方面树立了新的水平。 要求: 所需的最小 GPU 内存为 11GB,建议使用具有…

2024版新鲜出炉:最新大厂 Java 面试八股文合集(附权威答案)

谈到 Java 面试,相信大家第一时间脑子里想到的词肯定是金三银四,金九银十。好像大家的潜意识里做 Java 开发的都得在这个时候才能出去面试,跳槽成功率才高!但 LZ 不这么认为,LZ 觉得我们做技术的一生中会遇到很多大大小…

Latex之LNCS模板——使用bib添加参考文献

1、获取参考文献 从谷歌学术中获取bib格式的参考文献。 创建一个.bib文件,将参考文献复制进去。 2、添加参考文献 在文章最后引用.bib格式的参考文献。 \bibliographystyle{splncs04} % 格式 \bibliography{references.bib} % 文件名 LNCS模板中会包含该格式文件…

【考研数学 - 数二题型】考研数学必吃榜(数二)

数学二 suhan, 2024.10 文章目录 数学二一、函数❗1.极限1.1求常见极限1.2求数列极限1.2.1 n项和数列极限1.2.2 n项连乘数列极限1.2.3 递推关系定义的数列极限 1.3确定极限式中的参数1.4无穷小量阶的比较 2.连续2.1判断是否连续,不连续则判断间断点类型2.2证明题 二…

【HarmonyOS】鸿蒙应用低功耗蓝牙BLE的使用心得 (二)

【HarmonyOS】鸿蒙应用低功耗蓝牙BLE的使用心得 (二) 一、前言 目前鸿蒙应用的实现逻辑,基本都是参考和移植Android端来实现。针对BLE低功耗蓝牙来说,在鸿蒙化的实现过程中。我们发现了,鸿蒙独有的优秀点&#xff0c…

基于STM32的数字温度计教学

引言 数字温度计是许多电子项目中的常见应用,它可以实时监测周围环境的温度并显示。利用STM32微控制器实现数字温度计,可以帮助我们了解如何使用传感器进行模拟信号转换及数据传输。本教程将指导您使用STM32和DS18B20数字温度传感器实现一个简单的数字温…

go mod 依赖管理

什么是go mod go mod 是从 Go 1.11 版本开始引入的。Go Modules 是 Go 语言官方提供的一个版本管理工具,旨在解决依赖管理和版本控制的问题。从 Go 1.11 开始,Go Modules 被作为实验性功能引入,到了 Go 1.13 版本,Go Modules 成为…

洛谷解题日记||基础篇2

题目链接 0 剪刀&#xff0c;1 石头&#xff0c;2 布&#xff0c;3 蜥蜴人&#xff0c;4 斯波克我们可以根据题意&#xff0c;构建一个二维矩阵 result[5][5] 来表示每一种出拳的胜负情况。 #include <iostream> #include <vector> using namespace std;int m…

年会必备的抽奖小程序!

感觉一年一度的年会快来了&#xff0c;准备个小的抽奖小程序蛮陶冶情操的&#xff01; 正好今天有空整了一个&#xff0c;简单&#xff0c;简洁&#xff01;&#xff0c;大家也可以玩起来&#xff01; 技术栈&#xff1a; Flask 试玩的链接在这里,有意思的话也可以部署到自己的…