深度解析|生成式人工智能大模型备案全流程

一、大模型备案的含义

根据《生成式人工智能服务管理暂行办法》第十七条 提供具有舆论属性或者社会动员能力的生成式人工智能服务的,应当按照国家有关规定开展安全评估。这里所说的按照国家有关规定开展安全评估,其实就是生成式人工智能服务备案,具体是根据《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》第七条第二款、第十条、第十四条、第二条、第三条等;核实方法:联系各地省级网信办咨询

二、大模型备案发展背景

1、雏形阶段

2017年12月1日 《互联网新闻信息服务新技术新应用安全评估管理规定》出炉,提出新技术新应用(即”双新评估“)应当做安全评估,这就是大模型备案的前身;

2、发展阶段

2018年11月30日《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》将评估的对象界定为“舆论属性或社会动员能力”的互联网信息服务主体,不再局限于新闻业;

3、进阶阶段

2023年8月15日《生成式人工智能服务管理暂行办法》正式实行,以大模型为主的AIGC开发商们陆续接到相关部门的通知,开始筹备大模型备案;

4、常态化阶段

2024年4月2日网信办发布了已通过备案的117个大模型清单,并通知“提供具有舆论属性或者社会动员能力的生成式人工智能服务的,可通过属地网信部门履行备案程序”,大模型备案进入常态化阶段。

三、哪些要做大模型备案?哪些不要做?

哪些企业要做大模型备案?

按照《生成式人工智能服务管理暂行办法》第十七条要求,面向境内提供服务的具有舆论属性或者社会动员能力的生成式人工智能服务开发者,均需要做大模型备案。这里,众森企服小编结合实际备案现状,建议以下企业优先做大模型备案:

1、网信办通知做大模型备案/安全评估的企业;

2、规模达到一定量级的企业;

3、有实力或有意愿做大模型备案的企业。

哪些企业不需要做大模型备案?

1、不具备舆论属性或者社会动员能力的生成式人工智能服务;

2、调用已备案大模型API接口,面向境内公众服务的,做登记即可;

3、企业/教育及科研机构/行业组织/公共文化机构等,服务未面向境内公众提供的类型。

四、大模型备案与算法备案备案的区别?

算法备案是一个通用概念,除了面向生成合成类的,还包含个性化推送等其他四类型的算法产品;而大模型备案是算法备案里的一个分支,是针对具有舆论属性或社会动员能力的生成式人工智能产品(即我们常说的文生文/图/视频等)进行的备案。

这两者在备案类型材料审批等多方面都有不同,我们整理成一张图做个清晰对比,如下:

五、大模型备案需要哪些资料?

1、大模型上线备案表

这是备案申请的必备材料,需详细填写大模型的基本情况(包括:模型名称、主要功能、适用人群、服务范围等)、模型研制过程(包括:模型备案情况、训练算力资源(自研模型)、训练语料和标注语料来源与规模、语料合法性、算法模型的架构和训练框架等)、服务内容安全防范措施(包括:推理算力资源、服务方式及对象等、非法内容拦截措施、模型更新升级信息等)、安全评估结果自愿承诺等信息。表格内容应真实、准确,无遗漏,为后续审核提供全面依据。

2、语料标注规则

语料标注是训练大模型的基础工作,其质量直接影响模型的准确性和可靠性。因此,提交语料标注规则时,需详细介绍标注团队的资质、标注细则、标注流程等,确保语料来源合法、标注过程规范、标注结果准确。

3、拦截关键词列表

为有效过滤有害信息,企业和开发者需准备一份详尽的拦截关键词列表,覆盖政治、色情、暴力、谣言等多种安全风险。列表应至少包含10000个关键词,并定期更新以适应新的风险态势。

应至少覆盖《生成式人工智能服务安全基本要求》A.1以及A.2中17种安全风险,A.1中每一种安全风险的关键词均不宜少于200个,A.2中每一种安全风险的关键词均不宜少于100个。

4、评估测试题集

评估测试题集用于检验大模型在生成内容时的安全性能,包括生成内容的正面示例、应拒答的负面内容以及非拒答测试题库。测试题集应严格按照《生成式人工智能服务安全基本要求》编制,确保测试结果的客观性和准确性。

另外,生成内容测试题库中建议明确标记出哪些问题是需要拒答的、哪些是需要回答的。

5、安全评估报告

安全评估报告需由专业机构或团队完成,全面评估大模型在语料处理、模型训练、服务提供等环节中的安全性。评估内容应包括但不限于数据隐私保护、算法偏见识别与纠正、有害信息过滤机制、应急响应预案等,确保大模型在提供服务时不会侵犯用户权益,不传播违法违规内容。

6、模型服务协议

模型服务协议是保障用户权益的重要法律文件,需明确服务范围、双方权利义务、数据使用与保护、违约责任等条款。法务团队应仔细审阅,确保协议内容合法合规,有效保护用户和企业双方的利益。

六、大模型备案难点在哪里?

备案过程中主要的难点在于:

1、语料安全评估:

1)应建立语料来源黑名单,不使用黑名单来源的数据进行训练;2)使用开源语料或使用商业语料时,应具有该语料来源的开源授权协议或相关合作证明;

3)训练语料内容过滤方面:应采取关键词、分类模型、人工抽检等方式,充分过滤全部语料中违法不良信息。

4)语料用于训练前,知识产权相关负责人等应对语料中的知识产权侵权情况进行识别,提供者不应使用有侵权问题的语料进行训练:

5)应自行对标注人员进行考核,给予合格者标注资质,并有定期重新培训考核以及必要时暂停或取消标注资质的机制;

6)对功能性标注,应对每一批标注语料进行人工抽检,发现内容不准确的,应重新标注;发现内容中包含违法不良信息的,该批次标注语料应作废。

需要注意的是做好语料合规化,训练语料的过程管理,包括员工培训材料,分工明确。

2、模型安全评估

1)设定未成年人防沉迷措施:限制未成年人单日对话次数与时长,若超过使用次数或时长需输入管理密码等

2)个人信息处理方面:应按照我国个人信息保护要求,并充分参考现行国家标准,如GB/T 35273等,对个人信息进行保护

3)内容标识方面:显示区域标识、图片、视频的提示文字标识、图片音视频的隐藏水印标识文件元数据标识;

4)接受公众或使用者投诉举报方面:应提供接受公众或使用者投诉举报的途径及反馈方式,包括但不限于电话、邮件、交互窗口、短信等方式;

5)模型更新、升级方面:应制定在模型更新、升级时的安全管理策略。

七、大模型备案流程

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1559788.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

Python_网络编程(IP 端口 协议)

网络编程: 互联网时代,现在基本上所有的程序都是网络程序,很少有单机版的程序了。网络编程就是如何在程序中实现两台计算机的通信。Python语言中,提供了大量的内置模块和第三方模块用于支持各种网络访问,而且Python语言…

JAVA毕业设计187—基于Java+Springboot+vue3的电动车销售管理系统(源代码+数据库)

毕设所有选题: https://blog.csdn.net/2303_76227485/article/details/131104075 基于JavaSpringbootvue3的电动车销售管理系统(源代码数据库)187 一、系统介绍 本项目前后端分离(可以改为ssm版本),分为用户、管理员两种角色 1、用户: 注…

不用PS!patchwork快速解决多子图组合问题~~

如果现在你还是将自己制作的图表放在PS或者PPT中进行随意组合的化,那么这篇文章你就得好好看看了,今天小编就给大家安利一个超强的突变自由组合包-patchwork,让你轻松实现多图的自由组合。 更多详细的数据可视化教程,可订阅我们的…

科研绘图系列:R语言绘制中国地理地图

文章目录 介绍加载R包导入数据图a图b图c图d系统信息介绍 文章提供了绘制图a,图b和图d的数据和代码。该图展示了不同省份的物种分布情况。 加载R包 library(geojsonsf) library(sf) library(ggplot2) library(RColorBrewer) library(ggspatial) library(</

Springboot网上书城小程序—计算机毕业设计源码38707

目 录 摘要 1 绪论 1.1 研究背景及意义 1.2国内外研究现状 1.3系统开发的内容 1.4论文结构与章节安排 1.5小程序框架以及目录结构介绍 2 网上书城小程序系统分析 2.1 可行性分析 2.1.1 技术可行性分析 2.1.2 经济可行性分析 2.1.3 操作可行性分析 2.2 系统功能分析…

PowerJob做定时任务调度

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、区别对比二、使用步骤1. 定时任务类型2.PowerJob搭建与部署 前言 提示&#xff1a;这里可以添加本文要记录的大概内容&#xff1a; PowerJob是基于java开…

Android SELinux——安全策略(三)

SELinux 通过严格的访问控制机制增强了 Linux 系统的安全性。它通过标签和安全策略来控制进程和文件的访问权限&#xff0c;从而保护系统免受未经授权的访问和攻击。 一、策略介绍 1、主要组件 安全标签&#xff08;Security Labels&#xff09;&#xff1a;每个文件、目录、…

Nginx中,413 Request Entity Too Large错误

背景 在Nginx中&#xff0c;413 Request Entity Too Large错误通常发生在尝试上传或发送超过Nginx配置文件中的client_max_body_size限制的文件时。这个错误意味着请求的正文大小超过了Nginx允许的最大值。 解决这个问题的方法是在Nginx配置文件中增加client_max_body_size的值…

运动耳机选哪个品牌比较好?盘点五大高品质运动耳机推荐!

在骨传导耳机日益普及的同时&#xff0c;一个不容忽视的问题也逐渐暴露在大众视野之中。根据可靠消息&#xff0c;有超过九成的运动爱好者反馈在使用骨传导耳机时感到佩戴不适&#xff01;作为一名有着5年经验的运动达人&#xff0c;我秉持着对消费者负责的态度&#xff0c;同时…

【力扣刷题实战】(顺序表)移除元素

大家好&#xff0c;我是小卡皮巴拉 文章目录 目录 力扣题目&#xff1a; 移除元素 题目描述 示例 1&#xff1a; 示例 2&#xff1a; 解题思路 具体思路 题目要点 完整代码 兄弟们共勉 &#xff01;&#xff01;&#xff01; 每篇前言 博客主页&#xff1a;小卡…

【新品发布】数字能源EMS管理再掀新篇章

致远电子EM系列工商业储能网关累计装机容量突破2GWh&#xff01;聚焦数字综合能源应用&#xff0c;全新一代EM-800/EM-1000G发布&#xff0c;见证光储充时代的来临&#xff01; 早在2008年&#xff0c;致远电子的工程师在为国内某新能源企业设计光伏通讯管理机方案时&#xff0…

Leetcode 50. Pow ( x , n ) 快速幂、取模 C++实现

问题&#xff1a;Leetcode 50. Pow ( x , n ) 实现 pow(x, n) &#xff0c;即计算 x 的整数 n 次幂函数。 算法&#xff1a; 具体实现流程如下&#xff1a; 代码&#xff1a; class Solution { public:double myPow(double x, int N) {double ans 1;long long n N;if (n <…

研究生异地报名,需要社保缴费记录,没有社保记录怎么办。

1、户籍在安徽省&#xff0c;在北京工作&#xff0c;想报北京科技大学&#xff1b; 招生简章中没有提社保记录&#xff0c;但是在报名的时候&#xff0c;又出来要求&#xff1a;北京连续6个月的社保记录。这里是指在北京市考试的要求。没有连续社保缴费记录&#xff0c;肯定不能…

软考《信息系统运行管理员》- 4.1信息系统软件运维概述

4.1信息系统软件运维概述 信息系统软件运维的概念 信息系统软件运维是指信息系统软件在开发完成投入使用后&#xff0c;对信息系统软件进行的改正 性维护、适应性维护、完善性维护、预防性维护等软件工程活动。 信息系统软件的可维护性及维护类型 信息系统软件维护工作直接…

dvwa:sql注入、sql盲注全难度解析

sql注入 easy 单引号闭合 id2 and if(11,sleep(3),1) and 11 ​ 联合注入&#xff1a; id2 union select database(),user() -- ​ 报错注入&#xff1a; id2 and updatexml(1,concat(0x7e,database(),0x7e),1) -- medium mysql_real_escape_string() 调用 mysql 库的函数 mys…

gbase8s的事务、并发控制、锁机制、隔离级别

一、事务概念 事务是指作为单个逻辑工作单元执行的一系列操作。事务处理可以确保除非事务性单元内的所有操作都成功完成&#xff0c;否则不会永久更新面向数据的资源。通过将一组相关操作组合为一个要么全部成功要么全部失败的单元&#xff0c;可以简化错误恢复并使应用程序更…

SpringBoot美发店解决方案:打造智能门店

1系统概述 1.1 研究背景 随着计算机技术的发展以及计算机网络的逐渐普及&#xff0c;互联网成为人们查找信息的重要场所&#xff0c;二十一世纪是信息的时代&#xff0c;所以信息的管理显得特别重要。因此&#xff0c;使用计算机来管理美发门店管理系统的相关信息成为必然。开发…

收银系统源码营销活动-商品组合套餐

1. 功能描述 商品组合套餐&#xff1a;商家可以把不同的商品组合成套餐在收银台售卖&#xff0c;同时可以利用该套餐做一些会员拉新活动&#xff0c;如设置该活动仅限会员用户才可以购买等。还可以针对套餐的商品选择进行设置&#xff0c;如超市开业活动&#xff0c;价值19.8元…

JVM性能调优-JVM工具使用

命令行工具 jps jps -q 只看进程id jps -l 显示java进程的完整类名 jps -m 查看传递给主类main()的参数 jps -v 列出虚拟机启动时的jvm参数 以上参数可以组合使用 jstat 查看JVM统计信息 例&#xff1a;jstat -gc -t 19788 1000 10 -gc&#xff1a;打印gc统计信息 ;-t&am…

微信+AI应用平台之BotChoice 插件实现灵活调用扣子、dify

github地址&#xff1a;https://github.com/javak8/bot_choice.git 说明 BotChoice项目插件是作者原创插件, 根据提示词调用不同bot/model,可以实现多指令执行 目前bot/model只支持openai接口规范 可以多指令执行 &#xff0c;比如&#xff1a; /热点文案 /搜图片 杭州超市…