AI大模型推动人机交互模式发生革命性变化,让更高效、更逼真、更智能的数智人应用成为可能。在9月7日举办的2023腾讯全球数字生态大会上,腾讯云智能数智人产品公布三大升级,依托行业大模型技术,实现数智人生产效率及交互体验提升,降低数字人应用门槛,加速推动AI数字人普惠。
其中,全新发布“通用口型版”小样本数智人,只需要1分钟真人口播视频,平台便可通过多模态数据输入,无需训练生成个性化口型,在1小时内制作出与真人近似的“数智人”。
腾讯云智能数智人创意展台
大模型技术助力数智人生产提效 生产时长缩短至1小时
今年4月,腾讯云智能小样本数智人生产平台首次对外发布,平台具有训练样本小、生产效率高、自动化生产等特性,可以轻松实现“自助式”数智人生产制作。依托行业大模型,腾讯云智能数智人工厂全新升级,覆盖三大方向:生成效率更高、应用场景更广、3D数智人生产运营更智能。
在生成效率上,全新发布的“通用口型”版小样本数智人,生产时间、生产素材需求都进一步降低。在AI大模型技术的加持下,基于自监督机制的通用多模态模型,通过扩充人像特征提取及口型关系绑定,无需训练即可生成每个人的个性化口型特征。这推动2D小样本数字人生产时长可从24小时缩短至1小时,生产素材简化至只需要1分钟真人口播视频。
在应用场景上,全新升级的“交互式”小样本数智人,支持“倾听等待状态”识别,能够根据真实对话场景进行手势的停顿、变化。这将使得“交互式”小样本数智人不再局限于短视频生产等单向播报场景,也可以广泛用于服务咨询等交互场景。
在生产运营上,依托AI建模绑定算法,腾讯云智能实现照片式生成3D形象,改变手工作业形式,大幅提升3D形象生成速度,支持批量打造3D数智人;同时,全面升级“智能驱动”3D数智人,可以基于语义为3D数智人自动匹配动作,让3D “数智员工”服务体验接近于真人员工。例如,围绕大模型客服,数智人可以依据大模型实时生成的答案,匹配相应的表情、动作,实现更自然的交互。
目前,腾讯云智能数智人被广泛应用于口播视频生产、直播带货等场景。以媒体领域为例,小样本数智人等技术正在为媒体数字化转型升级注入更多AI力量,包括南方日报、南方都市报等机构用数智人辅助采编团队生成口播视频,进一步提升内容生产效率。
发布数智人伙伴扶持计划,覆盖直播运营、营销代理、MCN等领域
此前,腾讯云智能提出自动化“AI+数智人工厂”的方向,通过做厚aPaaS数智人平台,致力于让合作伙伴能够应用开箱即用的数智人生产服务,快速完成大批量数智人形象、音色定制,开发出更多适用于垂直行业、垂直场景的数智人SaaS服务。目前,已经有数十家合作伙伴依托平台,向行业提供数智人直播SaaS、知识口播SaaS应用,覆盖医疗、传媒、金融多个行业。
为了推动数智人服务更广泛落地,以“普惠化”服务走入千行百业,腾讯发布了“数智人伙伴扶持计划”,为直播运营、营销代理、MCN等领域伙伴提供数字人技术支持。
首批腾讯云智能数智人授权合作伙伴包括北京风平智能科技有限公司、中数联成(广东)文化有限公司、深圳市单仁牛商科技有限公司,以及陕西医智诺信息科技有限公司。
首批腾讯云智能数智人授权合作伙伴
腾讯云副总裁、腾讯云智能解决方案负责人王麒表示,参与“数智人扶持计划”的企业,不仅能够获得腾讯云官方授权证书及官网展示,还会获得市场拓展专项资金、标杆案例联合发声等系列支持。
目前,腾讯云智能数智人已经覆盖3D写实、3D半写实、3D卡通、2D真人、2D卡通五种形象风格,可实现超细微面部情感表情以及数百种肢体动作,支持形象资产管理、业务服务配置及内容生产相关服务,以满足不同场景下的服务需求。
在数智人之外,AI大模型的应用正逐步渗透到千行百业的各个环节,包括设计、研发、生产、营销和服务等,一场由“大模型”驱动的“效能革命”正在悄然发生。基于此,腾讯云从产业客户实际需求出发,基于自研的腾讯混元大模型,同时支持业内主流的开源模型应用,从技术底座、平台能力和智能应用三个维度不断升级MaaS能力,助力客户构建专属大模型和智能应用,推动大模型在产业中的落地应用。未来,腾讯云还将推出更多开箱即用的大模型产品、服务,推动大模型等AI技术在实际生产、运营场景发挥效用。
本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:3164780!