作者|王俞现
身份|中移联元宇宙产业委副秘书长、中国文产协元宇宙专委会高级专家
4月18日,全球元宇宙大会北京站。下午,在大厂、上市公司扎堆的数字人专场论坛上,他最后一位出场。
没有真正的金刚钻,主办方的这种安排,对他来说,简直意味着作死,元界(ID:Metabod)为他捏了一把汗,但他乍一上台,不疾不徐,按照自我语境,一环扣一环,侃侃而谈。
他认为,数字人是元宇宙时代的基础设施,但这一天还没有到来。按照他的设想,这一天的到来,还需要五年甚至更长时间。那数字人当下存在的价值是什么?他给出的答案是流量担当!他说,从2017年开始,他与小伙伴就开始思考,如何不用昂贵的设备,或者依赖特别培训获得技术经验,让每个人都能拥有高级别的数字人。这一年他们研发出人工智能数字人直播平台——赛博演猿Cybactor。经过不断迭代,这套系统可以生成最高级别、可实时驱动、廉价的数字人。
2022年10月,他们将这套系统面向个人公开,用户只需用一个普通摄像头,就能够实现影视级别的面部、肢体及手势动作的精准捕捉。
“在这一点上,我们是全世界唯一能做到的。”他做出自我评价,看似主观,却有着深厚的技术做背景、底气。
他如此告诉元界(ID:Metabod),“如果没有我们的技术,整个产业都无法想象用一个普通摄像头去做电视台级别的数字人直播。”
在他看来,这种高级别的数字人,在国内数量特别少,不到300个,他们正在做的,是推出降维普及方案,每月599元就,。,可以让每位直播人,拥有达到央视虚拟主播水准的数字人。
他就是赵天奇,数字人AIGC平台全球领军企业——聚力维度创始人兼CEO,北京邮电大学博士、清华大学博士后毕业,2011-2015年师从徐大雄院士,2015-2019年师从戴琼海院士,英特尔、高通AI荣誉技术大使。
演讲毕,一圈人围着赵天奇加微信,这是任何其他演讲者没有达到的“待遇”。本期“中国元宇宙未来产业100人”访谈,元界(ID:Metabod)对话赵天奇。
这是一位将“挑战全世界都没做到的技术科研”,视为创业以来印象最深刻事情的、具有科学家底色的创业者。
目前,赵天奇和聚力维度,正在不遗余力地推动着行业向着预判的方向发展。不过,是美好想象,抑或临界爆发,还有不尽为人掌握的变量。
“中国元宇宙100人”访谈计划
【指 导】
中国文化产业协会文化元宇宙专委会
中国移动通信联合会元宇宙产业委
【牵头平台】
元界、央链直播、河南省数字经济产业协会、超创者
【联合发起】
元宇宙共识圈、乐生活与爱IT Plus、商业认知研究院、寻一创投、绮观商业Cstories
【新加入联合发起】
战略投资家、CIBA新经济
一)
与时俱进,研发AI数字人直播平台
元界:请简要介绍一下公司发展历程。
赵天奇:从2012年开始,聚力维度就围绕虚拟内容布局各个技术链条,开展研发工作。2016年聚力维度在3D内容领域崭露头角,自主研发的人工智能3D内容制作平台“峥嵘”,获得华为、三大运营商等行业巨头的一致认可。2017年公司正式开展数字人业务线,自主研发了人工智能数字人直播平台——“赛博演猿”,2022年10月正式推出公开版(个人版)软件,2023年3月实现了云服务功能。
元界:作为公司的两个产品,峥嵘、赛博演猿是公司在商业化道路上布局的两个赛道吗?赛博演猿的主要客户群体是哪些?
赵天奇:峥嵘是解决3D显示设备专有内容不足问题的,其使3D资源从稀缺走向海量,属于AIGC在3D显示的赛道。赛博演猿是解决数字化内容中高级数字人创作问题的,属于AIGC在直播和视频领域的赛道,后者更为通用。
赛博演猿目前定位的主要客户群体,是需要通过直播和短视频宣传的主播和企业。
二)
数字人背后的流量密码
元界:2021年全球进入元宇宙时代,你对元宇宙在中国的发展有什么预判?你如何描述数字人在元宇宙时代的价值?数字人的发展与元宇宙的发展有什么对应关系?你预测今年年底数字人达到10万,其依据是什么?
赵天奇:元宇宙在中国发展会从垂直领域开始落地,5-10之后开始通往通用领域,即先产业、后大众的发展模式。
作为一个自然世界中的人,我们不能进入原始的世界里面,但数字人扮演了这样一个角色。数字人可以让每个人进入元宇宙,元宇宙场景可以让数字人技术发挥出更多价值。从长了说,数字人是元宇宙终极到来时刻的基础建设。
如果我们每个人都拥有VR头盔,不用现实生活中在一起,也可以完成我们生活中的绝大多数的事情、工作和娱乐,那么这个时刻就到来了,但从现在看,这个时间还需要五年甚至更长的时间。
但数字人技术已经成熟,现在只需产业推广就可以快速扩大,因此我判断,到年底数字人可以达到10万人的应用规模。
元界:现在数字人还不是基建,那它的价值是什么?
赵天奇:它其实是一个流量密码。我们现在打开新媒体的平台,不管是抖音、快手、B站,如果你看到一个东西是你今天走在大街上、在你平时的办公室或生活里,就能看得到的,你肯定不想看。
现在整个行业背后的逻辑就是流量密码,数字人具有创意的无限可能,可谓是无极限。其新奇的形象、超现实的能力,以及整个内容表现形式,可以带来比真人多得多的流量。
元界:聚力维度也在做虚拟直播的推广尝试和商用,你们发现数字人直播里面藏着什么样的流量密码?哪些类型客户正在为此买单?
赵天奇:流量密码主要就在数字人的超越现实上,因为不是现实,所以可以更好看,可以更新奇,形象可以是非人,可以有特效,可以有功能,可以远程互动等。
这些超现实,就是我们看数字人直播和短视频的原因,这就是流量密码。目前各大企业,包括电视台、品牌方、运营商、广告制作商以及主播,都在为此买单。
元界:你对短视频和直播领域数字人的应用发展,有什么直观判断?
赵天奇:我认为短视频和直播领域的数字人下一步会有指数级增长。从几百快速发展到几千几万的数量规模。
元界:价格会是数字人产业发展的门槛吗?面对越来越多价格便宜的数字人出现,会出现大家争相拥有自己的数字人的场景吗?
赵天奇:价格过去是数字人产业发展的主要门槛,现在价格便宜的数字人解决方案,很多降低了质量。要确保质量不降,只降低价格才行。价格只是一个方面,只要虚拟主播的流量密码被大家发现,需要流量的企业和主播都会争相使用,这不是一个行业,是所有需要宣传和流量的行业都需要的。
三)
全球唯一的技术底气
元界:数字人产业发展需要什么样的技术底座?这个行业是否存在卡脖子的问题?
赵天奇:对于真人驱动数字人产业来说,数字人技术底座就是建模、驱动、渲染、交互。这个行业所谓的卡脖子问题就是技术不解决,行业无法壮大的问题。关于驱动方面我们已经解决了,目前还有半个问题就是模型问题。
元界:你说公司在驱动和建模上已经取得一些突破,是什么突破?在这两个领域及其它领域,还存在哪些有待突破的技术瓶颈?
赵天奇:在驱动上,我们实现一个普通摄像头就能对人表情、动作、手势的影视级捕捉。在建模上,我们可以用AIGC来自动生成高颜值多样性可驱动的数字人脸。
后边需要继续解决的问题还有AIGC生成非人角色问题、数字人复杂交互问题。
元界:这里面蕴含着哪些核心技术?公司怎么进入了这些核心技术领域?
赵天奇:核心在于人工智能技术与影视制作产业的结合创新,行业的发展推助我们进入了这些技术领域。
我们在2017年开始研究数字人技术之前,就已经完成了人工智能和影视结合的人工智能2D转3D技术,所以对于这种交叉赛道的创新,非常熟悉。
我们又针对这个专有方向,在数据采集、标注、模型训练、优化上,科研了6年时间。在每个环节都有创新,这才实现了用普通摄像头达成和百万级动捕设备同等的效果。
行业水涨船高,我们不断进入数字人高级别市场,每一个介入这一市场的企业都面临着高成本、高门槛的双重压力。成本,还主要来自于建模和驱动。为此,聚力维度从2017年初就动了一个念想,能不能让每一个人都能通过一个平台,生成高级别、可实时驱动、廉价的数字人创建,也不用昂贵的设备,或者特别依赖培训获得技术经验。
元界:这是赛博演猿的价值所在,那公司在技术上达到了怎样的水准?
赵天奇:我们能够实现影视级别的面部、肢体及手势动作的精准捕捉。在这一点上,我们是全世界唯一能做到。
我一直会做一个对比,苹果做的数字人,两只舌头只能往前伸,我们不仅可以往前伸,而且可以转圈伸,可以舔到嘴边任何一个部位。
在技术水平上,我们基于自研的人工智能算法,无需标记点、无需适配,仅需单个普通RGB摄像头,即可精准捕捉上千个面部微表情,并且达到全身肢体动态捕捉,从而实现用普通摄像头达成和百万级动捕设备同等的效果。
该技术是目前全世界唯一的免穿戴、低成本、高质量的单目摄像头动捕技术,以行业领先水准解决了数字人微表情逼真还原、无穿戴数字人动捕等行业难题。
在建模方面,聚力维度拥有行业顶级建模技术,通过真人扫描,匹配原画雕刻,生动呈现用户最想要的人物形象。
在无特殊具象定制需求的情况下,我们采用AIGC技术,可以高效率、低成本生成上百万个行业价值在50万元级别的数字人形象,让每个人都可以实时控制高级别数字人,完成短视频、直播、会议、综艺等各类元宇宙形态的内容生产,满足用户轻量化、随时随地虚拟直播的需要。
四)
AI驱动和真人驱动,是两条赛道
元界:在你看来,数字人行业如何分类?未来走向何方?
赵天奇:数字人行业主要分为两类:真人驱动和AI驱动。真人驱动是为了解决新奇内容,是为了流量;AI驱动是为了解决低端工作由AI取代、节省人工的问题。
真人驱动数字人之前,只有用传统捕捉设备的方案,现在刚刚进入第二阶段,普通人也可以用得起,用视觉捕捉来驱动高级别数字人。
元界:数字人市场,中外各有哪些优势?
赵天奇:中国数字人市场目前在AI驱动上没有国外的ChatGPT强。在真人驱动上,我们是唯一能做到普通摄像头捕捉,并达到影视级效果的。
我曾说,如果有第二家企业想追上聚力维度的技术水平,至少也要花费两三年的时间,这是从整个世界来说的。我们在这个专业领域早于全世界所有公司,拥有独特的行业积累,又有5年的先发优势,所以我们能做到全世界断档式领先。
如果没有我们的技术,整个产业都无法去想象一个普通摄像头去做电视台级别的数字人直播。
另外,形成这种最高级别的数字人,行业价值几十万。我们生成的都能达到这个级别,价格不用几十万,而且具有多样性。
最关键的是,可以驱动现在用生成图片的方式生成的美女帅哥们所形成的数字人,都是不能用的,但是我们这可以,而且发型、衣服等都可以自定义,让每一个人真正用得起,而且是高级别的,还可以把音量、重点、语速、情绪、情感这些东西都保留下来。
元界:公司的数字人与英伟达的数字人有何优劣?是否存在技术方向不一样的问题?
赵天奇:我们的数字人主要解决驱动、建模问题,英伟达主要是引擎和AI驱动,所以不是谁更好的问题,技术路线不同,环节不同。
过去一段时间,我们沟通了大量元宇宙企业,掌握了大量具体场景下的实践案例。有场景需求者可不吝沟通18603851537(同微信)。
五)
关于痛点与竞争
元界:赛博演猿还有哪些地方有待改进?在商业化上公司的痛点是什么?
赵天奇:目前还需要改进的主要是根据垂直场景的功能开发,比如直播交互。目前我们公司技术上已经解决了产业问题,在商业化上,聚力维度主要考虑的就是如何把颠覆性新产品通过用户教育和推广传播给整个生态,这也是公司主要的痛点。
元界:下一步会如何解决这一痛点?
赵天奇:我们会继续采用自己直播和渠道合作的方式,加大推广力度。我们也欢迎大家跟我们联合,为此推出了数字人加速器计划,第一批招募60家企业。我们还要聚焦赋能建模师,让他们按照我们的标准去建模。CG模型网已经跟我们达成战略合作,它们旗下大概有200万位建模师。
另外,整个产业高级别的数字人,还特别少,应该说还不到300人。我们在思考,如何让像央视这种高级别的虚拟主播,普通的主播也用得起。为此,我们推出每月599元就可以达到跟央视同样水平的、人人可用的高端数字人。你想做什么样的内容,想拥有什么样的流量就可以了。只有创意能够能够阻挡你,其它东西都阻挡不了。
元界:大元宇宙阶段,所有人都拥有数字人,真正实现生活、娱乐、工作等方方面面都在元宇宙。除了空间不同,在你看来,这与我们当下都离不开微信生态圈,有什么根本不同?
赵天奇:大元宇宙阶段,我们都带上VR头盔,在一个数字世界里娱乐和工作。互相传输的信息是3D沉浸的,所以可以做除了物理接触以外所有的事。而目前手机微信时代只能传输小屏幕的图像文字信息,所以有根本不同。
元界:公司会深耕数字人,还是也会向其它元宇宙领域发展?单纯发展数字人会不会面临被其它公司降维打击的可能性?
赵天奇:我们会深耕数字人方向,应用在直播元宇宙生态上。在大元宇宙到来的时候我们应该是与做VR设备、社交软件等公司形成组合关系,除非是对手的数字人技术和生态比我更强,否则不会被降维打击。
六)
初衷、使命、商业哲学与融资
元界:你创业的初衷是什么?目前如何定位聚力维度?有什么愿景、使命?
赵天奇:我的初衷是,用人工智能让艺术创作也能插上科技的翅膀飞向自动化。具体来说就是让每个人只要有创作能力就可以完成影视内容的直播和视频。目前在技术上已经达到了,下一步要在产业上海量落地。
聚力维度定位是数字人AIGC平台全球领军者,愿景是成为元宇宙时代的数字人头部服务商,服务超百万个人消费者,使命是让每个人用上新奇、有流量的数字人。
元界:创业以来你印象最为深刻的事情是什么?你信奉什么样的商业哲学,并怎么体现在企业内部?
赵天奇:最深刻的事就是挑战全世界都没做到的技术科研,但还迟迟做不出来,但有一天终于迎来关键突破的时刻。
我信奉的商业哲学是价值,是科研。人类走到今天就是靠科学的发展,不断的创造前所未有的新价值,这不仅是我的商业哲学,也是人生的意义。我们企业的小伙伴也都以创造前所未有的科技创新价值,为使命和荣誉。
元界:目前公司团队情况如何?是否还在融资?你希望提醒投资者关注公司的哪些点、线或面?
赵天奇:公司目前人员规模80人,企业研发人员占比超过一半,团队分为科研、开发、测试、业务以及运营团队。
我们主要是看哪些投资公司理解并认可真人驱动数字人赛道,我们希望组合更多资源,一起把这个产业数字人数量从百级发展到百万级。
@元界(ID:Metabod)出品