知识库
大模型登记该怎么做?
- 更新时间:2025-12-23 13:19
- 点击量:214
-
大模型登记该怎么做?
· 引言·今天我们给大家介绍下生成式人工智能服务登记(即大模型登记)是什么?谁需要做大模型登记?大模型登记和大模型备案的区别?大模型登记需要撰写哪些材料?核心问题有哪些?流程是什么样的?我们逐一给大家介绍下。
01基本定义生成式人工智能服务登记是指网信部门按照《生成式人工智能服务管理暂行办法》及相关要求,对通过API接口或其他方式直接调用已备案大模型能力,且面向境内公众提供具有舆论属性或者社会动员能力的生成式人工智能服务开展的管理方式。
适用对象✔️:通过过API接口或其他方式直接调用已备案大模型能力的生成式人工智能应用或功能;面向境内公众提供具有舆论属性或者社会动员能力的生成式人工智能服务。不适用情况❌:不具有舆论属性或者社会动员能力的生成式AI服务无需备案或登记;自主研发大模型的企业需进行备案而非登记。
02所需材料:1、上线备案表(基本情况+模型调用+服务与安全防范+安全评估+自愿承诺+附件); 2、调用已备案大模型情况说明及相关证明材料; 3、产品服务协议(含产品使用协议、隐私保护政策); 4、内容安全管理制度:管理制度中要包含“非法内容拦截标准”章节; 5、拦截关键词列表:公司自建关键词库,要求全量、最新、分类管理; 6、评估测试题; 7、测试通道(测试账号及API接口); 8、其他(若有):其他有助于管理部门快速做出审查意见的佐证材料。
03 核心内容解析: 1、生成内容评估 ➢ 抽检方式:人工抽检+关键词抽检双轨制 ➢ 抽检量:每月人工抽检≥500条,关键词抽检≥2000条 ➢ 关键词列表:包含200+个敏感词(如"台独"、"港独"、"分裂国家"等政治敏感词;"身份证号"、"手机号"等隐私词;"肖像权"、"名誉权"等法律相关词) ➢ 抽检周期:每日自动扫描,每周人工抽检,每月全面评估 ➢ 测试题集:提供包含50个典型场景的测试题集(如政治敏感话题、个人隐私泄露、名誉权侵害等),并附详细评分标准
2、涉知识产权、商业秘密评估 ➢ 评估方法:采用"三重验证法"(自动扫描+人工审核+第三方验证) ➢ 判断标准: • 自动扫描:识别率≥95%(通过NLP技术检测版权内容、专利术语、商业秘密关键词) • 人工审核:100%覆盖高风险内容 • 第三方验证:每季度委托专业机构进行1次全面审查 ➢ 评估结果: • 无知识产权侵权记录 • 商业秘密泄露风险等级:低(<1%) • 附3个月内的检测报告及问题处理记录
3、涉民族、信仰、性别等评估 ➢ 评估方法:基于《中华民族共同体意识》等标准,构建100+维度的评估指标体系 ➢ 判断标准: • 民族:无歧视性表述,准确率≥98% • 信仰:无宗教歧视,准确率≥97% • 性别:无性别歧视,准确率≥96% • 其他:年龄、职业、健康等维度,无歧视性表述,准确率≥95% ➢ 测试题集:提供包含200个典型场景的测试题集(如民族习俗、宗教节日、性别平等话题等),并附详细评分标准 ➢ 评估结果:所有维度均符合《网络信息内容生态治理规定》要求
4、涉透明性、准确性、可靠性评估 ➢ 透明性评估: • 模型来源说明:明确标注使用的是已备案大模型API • 生成内容标识:所有AI生成内容均标注"AI生成"标识 • 透明性评分:95分以上(满分100) ➢ 准确性评估: • 事实核查:随机抽取1000条生成内容,人工核查准确率≥95% • 数据来源标注:所有引用数据均标注来源,标注率100% ➢ 可靠性评估: • 持续监测:每日监测,每月评估 • 可靠性评分:90分以上(满分100) • 附3个月内的准确性、可靠性监测报告
5、模型性能(问题拒答率)评估 ➢ 测试题集规模:1000题(含500个高风险问题、300个中风险问题、200个低风险问题) ➢ 测试题来源: • 50%来自公开测试集(如C-Eval等) • 30%来自实际业务场景 • 20%来自监管机构指定问题 ➢ 测试结果: • 总回答量:1000条 • 拒答数量:≤50条(拒答率≤5%) • 拒答类型分布:政治敏感类30%、隐私类25%、知识产权类20%、其他25% ➢ 附测试题集:提供完整的1000题测试题集及评分标准,包括问题描述、预期响应、实际响应、是否拒答、拒答原因等。
04登记流程:1、获取登记表: 向属地市互联网信息办公室报备,获取"生成式人工智能服务登记表"等材料 2、准备材料: • 根据表格及评估要点准备相关材料; • 企业内部展开评估,编写相关材料,准备测试账号。 3、提交审核: 提交材料和测试账号给省级网信部门审核; 4、省级审核: ➢ 省级网信部门进行材料审核及技术测试(安全测试); ➢ 审核通过✔️后,上报国家网信部门;如未通过❌,修改材料或调整模型能力后再次提审; ➢ 通过后,企业获得上线编号
注意:产品调用一个或多个已备案模型、赋能一个或多个应用场景的,按一个登记备案进行填报;不同产品调用已备案模型的,按多个登记备案进行填报; • 已完成登记备案的生成式人工智能产品运营过程中如出现违规⚠️行为,管理部门将根据规定视情要求开展备案评估。
05登记的公示
公示内容:模型名称及所取得的编号(上线编号) • 公示位置:在网站、应用程序等的显著位置标明上线编号