行业主要上市公司:(002230)、(300058)、(603808)、(300413)、(600880)、(688088)、腾讯(00700)、百度(BIDU)等 本文中心数据:专利相关统计数据。 聪慧芽统计口径阐明:1)搜索关键词:数字人及与之相近似或相关关键词;2)搜索范围:题目、摘要和权益阐明;3)选择条件:简单同族申请去重、法律状态为实质检查、受权、PCT国际发布、PCT进入指定国(指定期),简单同族申请去重是依照受理局中止统计;行业选择参考数字经济分类对应国民经济分类。4)统计截至日期:2022年11月21日。5)若有特殊统计口径会在图表下方备注。下同。 1、数字人系统框架:由五大模块构成 虚拟数字人系统普通状况下由人物形象、语音生成、动画生成、音视频合成显现、交互等5个模块构成。人物形象依据人物图形资源的维度,可分为2D和3D两大类,从外形上又可分为卡通、拟人、写实、超写实等作风,这部分主要由建模技术生成;语音生成模块和动画生成模块可分别基于文本生成对应的人物语音以及与之相匹配的人物动画;音视频合成显现模块将语音和动画合成视频,再显现给用户。交互模块使数字人具备交互功用,即经过语音语义辨认等智能技术辨认用户的企图,并依据用户当前企图决议数字人后续的语音和动作,驱动人物开启下一轮交互。 2、真人驱动型数字人技术流程:CG技术的进一步持续 在真人驱动中,在完成原画建模和关键点绑定后,动捕设备或摄像头将基于真人的动作/表情等驱动虚拟数字人。 由于背地有真人操作,真人驱动型在动作灵活度、互动效果等方面有明显优势,一方面能够在影视内容的创作中减低消费成本,为影视行业降低门槛,推进影视级内容向消费级转化。另一方面则多用于虚拟偶像、重要直播中,辅佐虚拟数字人完成大型直播、现场路演等互动性、碎片化活动。 事实上,这种技术思绪能够看作是传统影视制造中,CG技术的进一步持续。近年来主要的技术突破在于动作捕获环节。随着图像辨认技术,姿势、表情等辨认算法的进步,昂贵的惯性或光学动捕设备不再是驱动的必备工具。普通摄像头分离理想的辨认算法通用能完成较为精准的驱动(如iPhone 12摄像头已可支持简单的动作捕获),显著降低了精密虚拟内容生成的门槛。 3、算法驱动型数字人技术流程:依赖深度学习模型 在计算驱动型中,虚拟数字人的语音表白、面部表情、细致动作将主要经过深度学习模型的运算结果实时或离线驱动,在渲染后完成最终效果。 计算驱动的虚拟数字人最终效果遭到语音合成(语音表述在韵律、情感、流利度等方面能否契合真人发声习气)、NLP技术(与运用者的言语交互能否顺畅、能否能够了解运用者需求)、语音辨认(能否精确辨认运用者需求)等技术的共同影响。固然在特定方向上,各感知类技术已有的商业化才干已足以支撑,但是,但要达成理想的综合效果,需求该公司在三个方面同时具有较强的综合才干。这也间接招致国内展开计算驱动型虚拟数字人业务的公司,大多是在感知技术方面有较强的综合实力,相对成熟的AI技术公司。 4、中国数字人行业专利规划:网易专利申请数量最多,游戏范畴专利占比较大 ——中国数字人行业抢手申请人:网易专利申请数量最多 中国数字人范畴专利申请数量TOP10申请人分别是网易(杭州)网络有限公司、腾讯科技(深圳)有限公司、北京达佳互联信息技术有限公司、北京字跳网络技术有限公司、维沃移动通讯有限公司、北京百度网讯科技有限公司、OPPO广东移动通讯有限公司、抖音视界有限公司、广州方硅信息技术有限公司、华为技术有限公司。 其中,网易(杭州)网络有限公司在数字人范畴专利申请数量最多,公司专利数量达1535项,腾讯科技(深圳)有限公司排名第二,其数字人范畴专利申请数量达1295项。 2)中国数字人行业技术构成:与游戏相关的专利占比超20% 从技术构成来看,目前“A63F13 视频游戏,即便用二维或多维电子显现器的游戏〔7,2014.01〕[2014.01]”申请数量最多,抵达3101项,占前十大技术总量比重23.62%;其次为“G06F3 用于将所要处置的数据转变成为计算机能够处置的方式的输入装置;用于将数据从处置机传送到输出设备的输出装置,例如,接口装置〔4〕[2006.01]”,专利数量抵达2442项,占前十大技术总量的比例达18.6%。 更多本行业研讨剖析详见前瞻产业研讨院《中国数字人产业展开前景预测与投资战略规划剖析讲演》,同时前瞻产业研讨院还提供产业大数据、产业研讨、产业规划、园区规划、产业招商、产业图谱、产业链咨询、技术咨询、IPO募投可研、IPO业务与技术撰写、IPO工作底稿咨询等处置计划。 |