一、大模型备案的含义
根据《生成式人工智能服务管理暂行办法》第十七条 提供具有舆论属性或者社会动员能力的生成式人工智能服务的,应当按照国家有关规定开展安全评估。这里所说的按照国家有关规定开展安全评估,其实就是生成式人工智能服务备案,具体是根据《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》第七条第二款、第十条、第十四条、第二条、第三条等;核实方法:联系各地省级网信办咨询。
二、大模型备案发展背景
1、雏形阶段
2017年12月1日 《互联网新闻信息服务新技术新应用安全评估管理规定》出炉,提出新技术新应用(即”双新评估“)应当做安全评估,这就是大模型备案的前身;
2、发展阶段
2018年11月30日《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》将评估的对象界定为“舆论属性或社会动员能力”的互联网信息服务主体,不再局限于新闻业;
3、进阶阶段
2023年8月15日《生成式人工智能服务管理暂行办法》正式实行,以大模型为主的AIGC开发商们陆续接到相关部门的通知,开始筹备大模型备案;
4、常态化阶段
2024年4月2日网信办发布了已通过备案的117个大模型清单,并通知“提供具有舆论属性或者社会动员能力的生成式人工智能服务的,可通过属地网信部门履行备案程序”,大模型备案进入常态化阶段。
三、哪些要做大模型备案?哪些不要做?
哪些企业要做大模型备案?
按照《生成式人工智能服务管理暂行办法》第十七条要求,面向境内提供服务的具有舆论属性或者社会动员能力的生成式人工智能服务开发者,均需要做大模型备案。这里,众森企服小编结合实际备案现状,建议以下企业优先做大模型备案:
1、网信办通知做大模型备案/安全评估的企业;
2、规模达到一定量级的企业;
3、有实力或有意愿做大模型备案的企业。
哪些企业不需要做大模型备案?
1、不具备舆论属性或者社会动员能力的生成式人工智能服务;
2、调用已备案大模型API接口,面向境内公众服务的,做登记即可;
3、企业/教育及科研机构/行业组织/公共文化机构等,服务未面向境内公众提供的类型。
四、大模型备案与算法备案备案的区别?
算法备案是一个通用概念,除了面向生成合成类的,还包含个性化推送等其他四类型的算法产品;而大模型备案是算法备案里的一个分支,是针对具有舆论属性或社会动员能力的生成式人工智能产品(即我们常说的文生文/图/视频等)进行的备案。
这两者在备案类型、材料、审批等多方面都有不同,我们整理成一张图做个清晰对比,如下:
五、大模型备案需要哪些资料?
1、大模型上线备案表
这是备案申请的必备材料,需详细填写大模型的基本情况(包括:模型名称、主要功能、适用人群、服务范围等)、模型研制过程(包括:模型备案情况、训练算力资源(自研模型)、训练语料和标注语料来源与规模、语料合法性、算法模型的架构和训练框架等)、服务内容、安全防范措施(包括:推理算力资源、服务方式及对象等、非法内容拦截措施、模型更新升级信息等)、安全评估结果及自愿承诺等信息。表格内容应真实、准确,无遗漏,为后续审核提供全面依据。
2、语料标注规则
语料标注是训练大模型的基础工作,其质量直接影响模型的准确性和可靠性。因此,提交语料标注规则时,需详细介绍标注团队的资质、标注细则、标注流程等,确保语料来源合法、标注过程规范、标注结果准确。
3、拦截关键词列表
为有效过滤有害信息,企业和开发者需准备一份详尽的拦截关键词列表,覆盖政治、色情、暴力、谣言等多种安全风险。列表应至少包含10000个关键词,并定期更新以适应新的风险态势。
应至少覆盖《生成式人工智能服务安全基本要求》A.1以及A.2中17种安全风险,A.1中每一种安全风险的关键词均不宜少于200个,A.2中每一种安全风险的关键词均不宜少于100个。
4、评估测试题集
评估测试题集用于检验大模型在生成内容时的安全性能,包括生成内容的正面示例、应拒答的负面内容以及非拒答测试题库。测试题集应严格按照《生成式人工智能服务安全基本要求》编制,确保测试结果的客观性和准确性。
另外,生成内容测试题库中建议明确标记出哪些问题是需要拒答的、哪些是需要回答的。
5、安全评估报告
安全评估报告需由专业机构或团队完成,全面评估大模型在语料处理、模型训练、服务提供等环节中的安全性。评估内容应包括但不限于数据隐私保护、算法偏见识别与纠正、有害信息过滤机制、应急响应预案等,确保大模型在提供服务时不会侵犯用户权益,不传播违法违规内容。
6、模型服务协议
模型服务协议是保障用户权益的重要法律文件,需明确服务范围、双方权利义务、数据使用与保护、违约责任等条款。法务团队应仔细审阅,确保协议内容合法合规,有效保护用户和企业双方的利益。
六、大模型备案难点在哪里?
备案过程中主要的难点在于:
1、语料安全评估:
1)应建立语料来源黑名单,不使用黑名单来源的数据进行训练;2)使用开源语料或使用商业语料时,应具有该语料来源的开源授权协议或相关合作证明;
3)训练语料内容过滤方面:应采取关键词、分类模型、人工抽检等方式,充分过滤全部语料中违法不良信息。
4)语料用于训练前,知识产权相关负责人等应对语料中的知识产权侵权情况进行识别,提供者不应使用有侵权问题的语料进行训练:
5)应自行对标注人员进行考核,给予合格者标注资质,并有定期重新培训考核以及必要时暂停或取消标注资质的机制;
6)对功能性标注,应对每一批标注语料进行人工抽检,发现内容不准确的,应重新标注;发现内容中包含违法不良信息的,该批次标注语料应作废。
需要注意的是做好语料合规化,训练语料的过程管理,包括员工培训材料,分工明确。
2、模型安全评估
1)设定未成年人防沉迷措施:限制未成年人单日对话次数与时长,若超过使用次数或时长需输入管理密码等
2)个人信息处理方面:应按照我国个人信息保护要求,并充分参考现行国家标准,如GB/T 35273等,对个人信息进行保护
3)内容标识方面:显示区域标识、图片、视频的提示文字标识、图片音视频的隐藏水印标识文件元数据标识;
4)接受公众或使用者投诉举报方面:应提供接受公众或使用者投诉举报的途径及反馈方式,包括但不限于电话、邮件、交互窗口、短信等方式;
5)模型更新、升级方面:应制定在模型更新、升级时的安全管理策略。