©自象限原创
作者|程心
编辑|周游
大模型的风,吹动虚拟数字人厂商野蛮生长(以下统称虚拟人)。
《虚拟数字人深度产业报告》预计,到2030年我国虚拟数字人整体市场规模将达到2700亿元,其中,“服务型虚拟人”总规模也将超过950亿元。
如同秃鹰盯上腐肉,嗅到万亿商机的各方势力,都欲分一杯羹,这也直接导致了目前的虚拟人玩家格局陷入了“混战”状态。
「自象限」根据各方数据不完全统计,目前国内虚拟数字人核心厂商约有6000家。而按天眼查的数据显示,相关厂商数量甚至超过6万家。
同时,随着大模型(Large Model)的兴起,虚拟人的产业格局也在发生深刻变化。
比如,虚拟人正在经历从制作流程降本到技术突破的关键阶段,从大语言模型到多模态能力,让虚拟人从展示突破到了实时互动,这意味着未来虚拟人可能只需要一个实时渲染的外观,就能拥有十分逼真的沟通能力。技术门槛的降低,也会让更多参与方加入到这个开拓中的市场。而狂奔半年后,百亿个虚拟人也逐渐渗透进各行各业,并逐步进入商业化阶段。
也就是说,在厂商“混战”的表面下,隐藏的不仅是巨大的商业利益,更是复杂的技术博弈。而牵动着虚拟人“木偶引线”的另一头,操控者们的世界也在发生翻天覆地的变化。
千亿市场,厂商“混战”
如果说元宇宙时期的虚拟人已经是一把大火,那大模型就相当于在这之上又烹上了一勺油。一瞬间,铺天盖地的数字人厂商涌来,将本就复杂的行业搅得愈发浑浊。
这其中,既包括从元宇宙时期就一直坚持虚拟数字人的厂商,也有依靠全栈技术优势轻松迈出第一步的大厂,更不乏闻风而来的换道厂商。
「自象限」初步了统计核心厂商的类型后发现,这些厂商大致可以分为四类:
▲图源:即构官网截图
提供制作平台的厂商产品则更加复杂,如魔珐科技的三款产品分别针对了不同场景进行,包括虚拟视频、虚拟人直播和独立的虚拟人服务,并且在后端打造了端到端的写实3D虚拟人工业化产线,包括从技术到调试到运营的“星云平台”,让虚拟人能够和大模型结合,长出“脑子”,真正实现3D交互。
相比之下,商汤既能够直接交付虚拟人产品,也打造了如影虚拟人制作平台,基于在视觉、语音领域积累的3万个算法模型,打造了集智能化生成、智能化驱动、智能化交互的数字人平台。在商汤智能化引擎驱动下,虚拟人能快速识别、反应,与用户建立起对话关系。并且,事后,虚拟人也不会“失忆”,继续学习迭代。
这也说明了,当下厂商不仅是商业模式上的竞争,更是技术先进性的比拼。
技术”三级跳“
从整个虚拟人的技术发展进程来说,大模型带来最核心的改变,是推动着虚拟人从第一阶段看起来“像人”,到能够与人实时互动。
▲图源:网络
大模型让虚拟人“长了脑子”,有了思考和推理能力,AIGC技术让虚拟人能够有“想法”,TTS(Text To Speech 文本转语音技术)技术则让虚拟人能够“表达”。
几天前,在GPT-4V版本更新,TTS实现了进步,文本驱动语音有了语气和口吻,在停顿、重音和自然交互程度上有了极大的提升。不仅可以模仿不同的口吻,甚至设定“渣女”时还学会了“夹子音”。
有行业专家推测:TTS技术端到端成熟后,对行业格局的改变会很大。因为虚拟人真的能够实时交互后,落到产业里才能产生实际价值。
从看起来像人,到实时互动,大模型推动着虚拟人完成二级阶跃,但这也只是一个新的开始。从元宇宙到大模型时代,虚拟人真正备受关注的内在原因在于,他将有可能是下一个虚拟时代的“入口”,背后连接着新的虚拟世界,入口属性让其变的既性感又危险。
国外最早布局虚拟人的微软小冰CEO李笛则认为:虚拟人未来是混合模型。
本质上,这两种观点的内核是一致的,只不过李笛的假设更为具体。下一阶段,将进入“虚拟人+”的阶段,虚拟人+RPA在企业内部打造数字员工;虚拟人+AI Agent,在C端打造陪伴型机器人;虚拟人+AR/VR,在3D空间打造可见的游戏NPC;虚拟人+具身智能,让人型机器人有了灵魂。
若将多种技术进行全面融合,虚拟人才真的能够成为“入口级应用”。届时,比拼的赛点将是虚拟人的开放程度、生态建设、场景拓展等一系列综合能力。
当虚拟人被赋予了更多能力,其背后的木偶引线到底还能否掌握在人的手里?
这个答案,也着实让人期待。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。
发布者:SEO优化专员,转转请注明出处:https://www.chuangxiangniao.com/p/921429.html