刚刚,重磅发布!阿里、腾讯、科大讯飞在列
6月20日午间,国家互联网信息办公室发布境内深度合成服务算法备案清单,包括阿里、腾讯、百度、科大讯飞等巨头的41个算法入围,这也是国内首批公开的算法备案清单。
值得注意的是,此次名单中大模型算法并不多,除了百度PLATO大模型算法和讯飞星火认知大模型算法之外,阿里的多模态算法达摩院交互式多能型合成算法也在列。
受到这一消息刺激,AI概念股午后突然发力,其中科大讯飞一度涨逾8%再创新高,而神州泰岳一度涨超13%,万兴科技、彩讯股份、创业黑马、光云科技等公司跟涨。
三家公司大模型入围
根据《互联网信息服务深度合成管理规定》第十九条明确规定,具有舆论属性或者社会动员能力的深度合成服务提供者,应当按照《互联网信息服务算法推荐管理规定》履行备案和变更、注销备案手续。根据规定,深度合成服务技术支持者应当参照履行备案和变更、注销备案手续。
在这一背景下,国家网信办首次发布的境内深度合成服务算法备案清单也引起市场关注。在清单公布的算法包括:美团在线智能客服算法、快手短视频生成合成算法、百度文生图内容生成算法、百度PLATO大模型算法、天猫小蜜智能客服算法、菜鸟物流智能客服算法、讯飞星火认知大模型算法、腾讯云语音合成算法等。
从入围算法的角色来看,主要分为两类:“服务提供者”和“服务技术支持者”。其中“服务提供者”主要针对C端APP,而“服务技术支持者”主要针对B端服务。在合计入围的44个算法中,前者占据其中36席。
值得注意的是,在首批备案清单中,明确的大模型并不多,有科大讯飞、阿里、百度三家。其中百度PLATO大模型算法应用于对话生成场景,其基于飞桨深度学习框架和对话语料训练的对话模型,生成开放域的文本回答,获得“服务提供者”备案。
阿里的达摩院交互式多能型合成算法则是应用于开放域多模态内容生成场景,服务于问答、咨询类的企业端客户,通过API提供根据用户输入生成多模态信息的功能,获得“服务技术支持者”备案。
而科大讯飞两大入围的算法分别为输入法、讯飞星火认知大模型算法,分别获得“服务提供者”和“服务技术支持者”两类备案。
加强监管成趋势
事实上,针对AI发展,各国政府和监管机构已开始采取措施加强监管,以确保公众利益和安全。截至目前,以中美欧为代表的多个国家和地区和国际组织已经做出了不同探索。
在今年4月11日,国家网信办就曾发布关于《生成式人工智能服务管理办法(征求意见稿)》公开征求意见的通知。
《办法》提到,利用生成式人工智能产品向公众提供服务前,应当按照《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》向国家网信部门申报安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。
《办法》适用于,面向中华人民共和国境内公众提供服务的研发、利用生成式人工智能产品。生成式人工智能,是指基于算法、模型、规则生成文本、图片、声音、视频、代码等内容的技术。并且,国家支持人工智能算法、框架等基础技术的自主创新、推广应用、国际合作,鼓励优先采用安全可信的软件、工具、计算和数据资源。
《办法》提出,提供生成式人工智能产品或服务应当遵守法律法规的要求,不得含有颠覆国家政权、推翻社会主义制度以及可能扰乱经济秩序和社会秩序的内容;防止出现种族、民族等歧视;不得利用算法、平台等优势实施不公平竞争;防止生成虚假信息;禁止非法获取、披露、利用个人信息和隐私、商业秘密。
这也意味着数据安全和隐私保护已经成为AI发展的前提和关键。在业内看来,网信办发布管理办法的首先强调了安全评估和算法备案的前提性和必要性;其次强调提供者需确保数据安全和个人信息保护合规,尤其是隐私保护;最后夯实了违规责任的处罚措施,包含追究刑事责任。
大模型百花齐放
今年以来,国产AI大模型迎来百花齐放之势。从时间上来看,百度“文心一言”最早于3月16日发布。发布会后一小时内,排队申请文心一言企业版API调用服务测试的企业用户已达3万多家,申请产品测试网页多次被挤爆。
而在4月7日,在阿里云峰会上,阿里云大语言模型“通义千问”正式推出,现阶段该模型主要定向邀请企业用户进行体验测试。另外,阿里巴巴决定未来将所有产品接入通义千问,进行全面改造。
4月10日,商汤科技董事长兼首席执行官徐立宣布推出大模型体系商汤日日新大模型体系。随后,腾讯、网易、京东也相继公开了自家的大模型产品“混元”、“玉言”和“ChatJD”。
而传统AI巨头科大讯飞的讯飞星火认知大模型也于5月6日面世。随后科大讯飞又在6月9日发布讯飞星火认知大模型V1.5。据科大讯飞方面透露,其文本生成能力有7%的提升,语言理解能力提升了8%,知识问答提升了24%,在逻辑推理、数学能力和代码能力上分别有了10%、9%和8%的提升。
附件
境内深度合成服务算法备案清单(2023年6月)
序号 |
算法名称 |
角色 |
主体名称 |
应用产品 |
主要用途 |
备案编号 |
备注 |
1 |
大麦小蜜智能客服算法 |
服务提供者 |
北京大麦文化传媒发展有限公司 |
大麦(APP) |
应用于在线智能客服场景,根据用户咨询内容,生成文本或语音智能回答。 |
网信算备110101128387701230011号 |
|
2 |
DraftAi绘图生成合成算法-1 |
服务提供者 |
图形起源(北京)科技有限公司 |
Draft(网站) |
应用于图像生成场景,使用文本条件图像生成模型,生成与输入文本语义一致的图像。 |
网信算备110108007153201230015号 |
|
3 |
智谱ChatGLM生成算法 |
服务提供者 |
北京智谱华章科技有限公司 |
ChatGLM(网站) |
应用于对话生成场景,根据用户输入的文本内容,应用对话模型,生成对话文本回复。 |
网信算备110108105858001230019号 |
|
4 |
美团电话智能客服算法 |
服务提供者 |
北京三快科技有限公司 |
美团(APP) |
应用于电话智能客服场景,生成用户问题的语音智能回答。 |
网信算备110108224236601220017号 |
|
5 |
美团在线智能客服算法 |
服务提供者 |
北京三快科技有限公司 |
美团(APP) |
应用于电话智能客服场景,生成用户问题的文本智能回答。 |
网信算备110108224236601220025号 |
|
6 |
快手短视频生成合成算法 |
服务提供者 |
北京快手科技有限公司 |
快手(APP) |
应用于短视频制作场景,利用生成模型对用户上传图片、视频进行属性编辑或风格转换,生成图片、视频。 |
网信算备110108413760701220011号 |
|
7 |
百度文生图内容生成算法 |
服务提供者 |
北京百度网讯科技有限公司 |
文心一格(网站) |
应用于图像生成场景,利用图文匹配神经网络模型和扩散生成模型,生成与输入文本语义一致的图像。 |
网信算备110108645502801230019号 |
|
8 |
百度PLATO大模型算法 |
服务提供者 |
北京百度网讯科技有限公司 |
小侃星球(APP) |
应用于对话生成场景,基于飞桨深度学习框架和对话语料训练的对话模型,生成开放域的文本回答。 |
网信算备110108645502801230027号 |
|
9 |
剪映特效算法 |
服务提供者 |
北京抖音信息服务有限公司 |
西瓜视频(APP)、轻颜(APP)、剪映(APP)、抖音短视频(APP)等 |
应用于图像、视频生成场景,基于人像理解技术和视频剪辑技术实现对用户上传图片或视频的渲染处理与格式转换,生成编辑处理后图像或视频。 |
网信算备110108823483901230015号 |
|
10 |
火山引擎智能美化特效算法 |
服务技术支持者 |
北京抖音信息服务有限公司 |
-- |
应用于图像生成场景,服务于图像编辑类的企业端客户,通过API提供人脸图像美颜功能。 |
网信算备110108823483901230023号 |
|
11 |
出门问问语音合成类算法-2 |
服务技术支持者 |
出门问问信息科技有限公司 |
-- |
应用于音频生成场景,服务于音频、视频制作类的企业端客户,通过API提供文本转语音功能。 |
网信算备110108928160101230017号 |
|
12 |
淘票票小蜜智能客服算法 |
服务提供者 |
上海淘票票影视文化有限公司 |
淘票票(APP) |
应用于在线智能客服场景,根据用户咨询内容,生成文本或语音智能回答。 |
网信算备310107361090201230011号 |
|
13 |
1688阿牛智能客服算法 |
服务提供者 |
杭州阿里巴巴广告有限公司 |
1688工业品(APP)、阿里巴巴(APP、网站) |
应用于在线智能客服场景,根据用户咨询内容,结合智能客服知识库,生成文本、图像、音频、视频等形式的回答。 |
网信算备330108445385801230017号 |
|
14 |
天猫小蜜智能客服算法 |
服务提供者 |
浙江天猫网络有限公司 |
手机天猫(APP) |
应用于在线智能客服场景,识别文字或语音问题,结合智能客服知识库,生成文本、图像、音频、视频等形式的回答。 |
网信算备330110046572901220019号 |
|
15 |
钉钉语音识别算法 |
服务提供者 |
钉钉科技有限公司 |
钉钉(APP) |
应用于即时通讯场景,识别语音消息,生成识别后的文本信息。 |
网信算备330110391028001220019号 |
|
16 |
钉钉翻译算法 |
服务提供者 |
钉钉科技有限公司 |
钉钉(APP) |
应用于即时通讯场景,实现对特定语种的翻译服务,生成翻译后文本信息。 |
网信算备330110391028001220027号 |
|
17 |
钉钉图像识别文字算法 |
服务提供者 |
钉钉科技有限公司 |
钉钉(APP) |
应用于即时通讯场景,提取识别图片中文字,生成提取后的文本信息。 |
网信算备330110391028001220035号 |
|
18 |
钉钉智能客服算法 |
服务提供者 |
钉钉科技有限公司 |
钉钉(APP) |
应用于在线智能客服场景,根据用户咨询内容,结合智能客服知识库,生成文本、图像、音频、视频等形式的回答。 |
网信算备330110391028001230039号 |
|
19 |
达摩院开放域自然对话合成算法 |
服务技术支持者 |
阿里巴巴达摩院(杭州)科技有限公司 |
-- |
应用于对话生成场景,服务于智能对话类的企业端客户,利用对话意图理解、对话内容生成等技术,通过API提供对话生成功能。 |
网信算备330110507206401230019号 |
|
20 |
达摩院图像合成算法 |
服务技术支持者 |
阿里巴巴达摩院(杭州)科技有限公司 |
-- |
应用于图像生成场景,服务于图像合成类的企业端客户,通过API提供文字信息转化为图像信息的功能。 |
网信算备330110507206401230027号 |
|
21 |
达摩院交互式多能型合成算法 |
服务技术支持者 |
阿里巴巴达摩院(杭州)科技有限公司 |
-- |
应用于开放域多模态内容生成场景,服务于问答、咨询类的企业端客户,通过API提供根据用户输入生成多模态信息的功能。 |
网信算备330110507206401230035号 |
|
22 |
淘特小蜜智能客服算法 |
服务提供者 |
杭州拣值了电子商务有限公司 |
淘特(APP) |
应用于智能客服场景,根据用户咨询内容,结合智能客服知识库,生成文本、图像、音频、视频等形式的回答。 |
网信算备330110525191901230019号 |
|
23 |
淘宝人生表情动作复刻算法 |
服务提供者 |
浙江淘宝网络有限公司 |
手机淘宝(APP) |
应用于形象图片制作场景,识别照片中人物表情动作,生成淘宝人生形象图片。 |
网信算备330110872770701220015号 |
|
24 |
菜鸟物流智能客服算法 |
服务提供者 |
杭州菜鸟物流信息科技有限公司 |
菜鸟(APP、小程序) |
应用于智能客服场景,根据用户提问分析用户诉求,生成文本智能回答。 |
网信算备330110977354701220013号 |
|
25 |
讯飞语音识别算法 |
服务提供者 |
科大讯飞股份有限公司 |
讯飞输入法(APP) |
应用于文本生成场景,提取语音中声学特征,结合语言模型,识别短音频,生成文本信息。 |
网信算备340104764864601230013号 |
|
26 |
讯飞星火认知大模型算法 |
服务技术支持者 |
科大讯飞股份有限公司 |
-- |
应用于开放域对话生成场景,利用文本、代码、prompt数据及用户反馈数据训练AI大模型,服务于问答、咨询类的企业端客户,通过API提供文本生成服务。 |
网信算备340104764864601230021号 |
|
27 |
美图图像深度合成类算法 |
服务提供者 |
厦门美图网科技有限公司 |
美图设计室(APP)、美图秀秀(APP)、美颜相机(APP)等 |
应用于图像生成场景,基于图像内容理解结果,实现对用户上传照片的艺术化重新生成。 |
网信算备350203814951001230015号 |
|
28 |
UC小蜜智能客服算法 |
服务提供者 |
广州市动景计算机科技有限公司 |
UC浏览器(APP) |
应用于在线智能客服场景,利用自然语言技术定位用户需求,生成文本、图像、音频、视频等形式的回答。 |
网信算备440106203028801230019号 |
|
29 |
易次元生成合成算法 |
服务提供者 |
广州网易计算机系统有限公司 |
易次元(APP) |
应用于对话生成场景,根据用户输入内容,应用对话模型,生成对话文本回复。 |
网信算备440106306769001230011号 |
|
30 |
酷狗音乐语音克隆算法 |
服务提供者 |
广州酷狗计算机科技有限公司 |
酷狗音乐(APP) |
应用于音频生成场景,基于用户录音数据,提取用户音色特征,生成与用户音色一致的音频信息。 |
网信算备440106592132901230019号 |
|
31 |
酷狗音乐歌声合成算法 |
服务提供者 |
广州酷狗计算机科技有限公司 |
酷狗音乐(APP) |
应用于音频生成场景,基于用户歌唱录音数据,提取用户音色特征,制作歌曲。 |
网信算备440106592132901230027号 |
|
32 |
音书语音识别算法 |
服务提供者 |
广州音书科技有限公司 |
音书(APP) |
应用于语音转文字场景,识别实时录音数据,生成识别后的文本信息。 |
网信算备440113773328701230015号 |
|
33 |
秀脸FacePlay人脸融合算法 |
服务提供者 |
深圳市鹏中科技有限公司 |
秀脸FacePlay(APP) |
应用于人脸图像、视频生成场景,将用户上传的照片与特定形象进行面部融合,生成融合后的人脸图像、视频。 |
网信算备440304083805101230015号 |
|
34 |
腾讯云人脸融合算法 |
服务技术支持者 |
深圳市腾讯计算机系统有限公司 |
-- |
应用于人脸图像、视频生成场景,服务于图像、视频编辑类的企业端客户,通过API提供用户面部特征融合功能。 |
网信算备440305295988701230013号 |
|
35 |
腾讯会议虚拟背景算法 |
服务提供者 |
深圳市腾讯计算机系统有限公司 |
腾讯会议(APP) |
应用于视频会议场景,利用人像分割得到像素级背景区域,实现对视频背景区域的模糊或替换,生成背景虚化或背景替换后的视频。 |
网信算备440305295988701230021号 |
|
36 |
腾讯云语音合成算法 |
服务技术支持者 |
深圳市腾讯计算机系统有限公司 |
-- |
应用于文本转语音场景,服务于音频、视频合成类企业端客户,使用已授权的声优声纹信息,通过API提供文本转语音功能。 |
网信算备440305295988701230039号 |
|
37 |
腾讯音乐语音合成算法 |
服务提供者 |
腾讯音乐娱乐(深圳)有限公司 |
QQ音乐(APP)、全民K歌(APP) |
应用于文本转语音场景,利用语音合成技术,将文本内容转化为有声读物。 |
网信算备440305544180001230019号 |
|
38 |
逗拍风格迁移算法 |
服务提供者 |
深圳市闪剪智能科技有限公司 |
逗拍(APP) |
应用于视频制作场景,根据用户选择的模板,修改用户上传图片的风格,生成风格化视频。 |
网信算备440306133199401220023号 |
|
39 |
逗拍动作驱动算法 |
服务提供者 |
深圳市闪剪智能科技有限公司 |
逗拍(APP) |
应用于人脸视频生成场景,将用户上传的照片与模板视频进行面部融合,生成与模板视频的人像表情和动作一致的人脸视频。 |
网信算备440306133199401230035号 |
|
40 |
逗拍人脸融合算法 |
服务提供者 |
深圳市闪剪智能科技有限公司 |
逗拍(APP) |
应用于人脸图像、视频生成场景,将用户上传的照片与特定形象进行面部融合,生成融合用户面部特征的人脸图像、视频。 |
网信算备440306133199401230043号 |
|
41 |
逗拍人脸属性编辑算法 |
服务提供者 |
深圳市闪剪智能科技有限公司 |
逗拍(APP) |
应用于人脸图像编辑场景,通过修改用户上传照片中人脸属性信息,改变照片人物的外貌特征。 |
网信算备440306133199401230051号 |