虚拟数字人的昨天、今天和明天

  湖南日报·新湖南客户端   2023-09-12 11:35:19

编者按:近年来,突破了二次元壁垒的一大批各具特色的虚拟数字人高频次出现在用户面前,受到不同年龄段人群的关注和追捧,虚拟数字人的应用场景越来越丰富。

相比元宇宙发展的不确定性,虚拟数字人的功能定位显然更加清晰。《中国AI数字人市场现状与机会分析2022》报告显示,中国虚拟数字人市场规模呈现高速增长趋势,预计到2026年将达到102.4亿元。《虚拟人深度产业报告》则指出,到2030年,我国虚拟数字人整体市场规模将达到2700亿元。更有机构预测,未来将会有许多职业可能被虚拟数字人替代。

从受众到技术,从技术到内容,虚拟数字人行业经历了怎样的发展历程?未来的发展方向和破局之路又在何方?

一、“Z世代”和品牌方眼中的“完美偶像”

2019年7月19日晚,上海梅赛德斯—奔驰文化中心内座无虚席,在全场近万人的应援声中,一场精彩演出持续时间长达3个多小时。与众不同的是,站在舞台中央的主角并非真实存在的人气偶像明星,所有演出嘉宾均为虚拟偶像。“初音未来”与“洛天依”两位人气虚拟偶像首次在线下演唱会同台,点燃了现场粉丝的热情,随节奏整齐挥舞的绿色、蓝色荧光棒构成炫目海洋……

这是一种名为“全息演唱会”的新兴演出形式,演唱会上的演出嘉宾为虚拟偶像,而演唱会的有趣之处在于可以通过全息真实化摄影技术让虚拟偶像真实出现在舞台之上,并与观众进行互动,从而呈现满满的科幻感。

作为伴随互联网和智能设备发展成长起来的一代人,娱乐是“Z世代”内容消费的主要动机,动画(Animation)、漫画(Comics)、游戏(Games)等ACG文化成为该群体最普遍的兴趣爱好,并已渗透到他们的社交场景和沟通语境。相比真人,很多“Z世代”更愿意选择ACG文化中的虚拟形象作为他们的倾慕对象。于是,虚拟数字人——存在于非物理世界中,由技术手段创造及使用,并具有多重人类特征的综合产物——逐渐为“Z世代”接受和喜爱。

“初音未来”是虚拟偶像界的元老级“人物”。虽然“她”诞生于日本,但在国内的名气也非常高,随着“她”的家族越发强大,不同性格、外形的“兄弟姐妹”陆续登场,让很多年轻人开始对虚拟偶像有了较为全面和深刻的认知。

国民熟知的“洛天依”是全球第一个拥有VOCALOID(日本乐器制造商雅马哈公司开发的电子音乐制作语音合成软件,中文名称:博歌乐)中文声库的虚拟形象。出道9年后,“她”登上了2021年春节联欢晚会的舞台,出席了2022年北京冬奥会文化节开幕式。

二次元风格的虚拟偶像之后,虚拟数字人开始向“拟人化”迈进,一些虚拟数字人甚至可以做到以假乱真,几乎与真人无异。

2021年5月,虚拟数字人“AYAYI”凭借一张个性形象图在小红书亮相,随即迅速走红。此后,“她”与LV、娇兰等奢侈品牌达成合作,还受邀参加了环球影城、迪士尼等主题公园的线下活动,更“入职”了阿里,成为天猫超级品牌日的数字主理人。与此同时,“柳夜熙”、偶像女团“A-SOUL”等其他人气火爆的虚拟数字人,也在各自的领域发展得风生水起。

随着“Z世代”年轻人逐渐成为消费主力,对于品牌方而言,通过自建品牌虚拟数字人或是与知名虚拟数字人合作的全新代言方式,与真人明星代言的传统方式相比,有着不可比拟的优势。

第一,选择虚拟数字人的方式更灵活多样。 一方面,品牌可以直接打造专属的虚拟数字人形象,可以是品牌领导人的数字化身、也可以是符合品牌调性的动漫数字形象;另一方面,品牌也可在已经成名的虚拟数字人中直接挑选,使其成为品牌虚拟代言人或是展开其他层面合作。无论选择哪种方式,对品牌而言,都是顺应趋势的必要举措。

第二,可以让品牌自身需要承担的风险降至最低。 作为品牌形象代言人,真人明星“翻车”事件屡见不鲜。更重要的是,品牌方对这些“翻车”事件普遍难以防范,“翻车”前无法提前预判、“翻车”时和“翻车”后无法有效控制。最终结果是,品牌自身不得不吞下“看错人”带来的一系列苦果。造成严重后果的“翻车”事件在虚拟数字人身上不会出现。

第三,品牌可以获得更好的营销效果。 品牌营销随消费者和消费场景的变化而变化,这是客观规律。当这些消费观念与上几代人存在极大差异的“Z世代”年轻人逐渐成长为未来最有消费意愿和能力的群体,投其所好也就显得顺理成章。“品牌+虚拟数字人”的营销思路已经形成,契合品牌调性和消费者心理预期的虚拟数字人,以深层次的情感为纽带,让消费者产生情感共鸣和社交满足,品牌进而获得在转化层面的更多收益。

第四,品牌可沉淀年轻化私域流量,并在其中占据主导权。 虚拟数字人是促成品牌加速年轻化转型的必由之路,尤其是当孵化出成功的品牌数字人之后,靠品牌数字人的魅力吸引而来的年轻粉丝自然而然转变为品牌年轻化的私域流量,不但让品牌由此变得更年轻、更贴近消费者,在后续粉丝社群运营等层面,品牌方亦可掌握较之以往更大的话语权和主导权。

第五,持续产出优质内容,最终实现品牌价值提升。 虚拟数字人在品牌营销中扮演的角色不局限于形象代言。视频营销和直播电商时代,足够优秀的虚拟数字人自带持续产出各类优质内容的潜质。随着更多品牌加大对虚拟数字人和虚拟数字人内容营销的投入,全能型虚拟数字人已具备实际运营转化的能力,最终为品牌带来口碑和收益的双赢价值。

二、赋能各行各业 释放商业价值

“大家好,我是安庆博物馆数字讲解员,您可以向我提问……”大型展会上,“爱夏”以主持人的身份,通过动作捕捉、AI、3D动态等技术为参会人员提供导览讲解、信息查询、热点问题解答等语音实时交互服务。作为硅基智能品牌IP形象,虚拟数字人“爱夏”已应用于各大商业化场景。

炎炎夏日,“度晓晓”出现在田间地头,向人们展示了挑选当地特产蜜瓜、病虫害识别、快速数瓜等多项AI助农超能力,并通过脱口秀直播成功带货2吨蜜瓜。作为百度推出的虚拟数字人,“度晓晓”可以完成包括聊天、定外卖、讲故事、写作绘画在内的多项智能互动。

2023年,虚拟数字人的应用场景更加广泛,“TA们”在虚拟偶像、虚拟主播、企业IP、虚拟员工等多方向均有应用。新业态不断衍生,既源于虚拟数字人与前沿人工智能技术的紧密结合,也与众多企业入场密不可分。

AI技术,尤其是AIGC技术(包括自然语言、图像、声音等多模态处理)的快速突破,让虚拟数字人的发展进入新阶段。AI技术覆盖虚拟数字人建模、视频生成、驱动等全流程。一方面,AI技术使虚拟数字人的制作成本降低、制作周期缩短,并可获得与真人更加相似的外形、动作效果,例如在3D虚拟数字人的建模环节,AI建模相比人工建模所需时间大幅缩短、效率提升明显。另一方面,多模态AI让虚拟数字人的交互能力更上一个台阶,随着AI技术的不断完善,虚拟数字人的感知能力、思维能力、内容输出能力都得到显著改善,在思想、语言、行为上和人类更加接近。

技术驱动下,国内各AI厂商、互联网大厂、垂直ISV(Independent Software Vendors,独立软件开发商)均可提供较为成熟的具有AIGC能力的虚拟数字人产品及解决方案。与此同时,人们对虚拟数字人的关注度也在不断提升。艾媒咨询的数据显示,中国网民对虚拟数字人的关注度从2021年的63.6%上升至2022年87.8%。其分析师认为,社交媒体多元化发展推动了虚拟数字人的宣传,使“TA们”在网民中的渗透率提升;虚拟数字人的涌现,也使整个行业的商业价值不断释放,激发更多年龄段受众的消费行为。

今天,虚拟数字人不仅可以提供智能机器人的全部功能,还具有人的外形,可智能识别问题和诉求、判断用户情绪、与用户交互沟通,配合智能大屏、全息现实、AR/VR等技术,带来更高效、更智能、更人性化的服务体验。

医疗行业

虚拟数字人出现在医疗APP、医院导诊机器人等智能医疗助手中,结合医疗相关NLP(Natural Language Processing,自然语言处理)技术,患者在就医咨询时感觉是在与真正的医生交谈,获得与线下问诊近乎一致的体验,大大缓解了个人用户关于身体健康、就医前咨询等需求量级大幅增加的问题。

在扮演智能医疗助手的过程中,虚拟数字人有以下优势:近乎真人形象的医疗助手,可缓解患者的焦虑,营造可信赖的问诊咨询体验;24小时在线,专业地解答用户的问题;能够更好地保护患者个人隐私;节省医疗资源,让专业的医护人员将更多精力投入到病人的救治中。

此外,虚拟数字人还作为人类的数字化身应用在医学教学和临床治疗中,如用于医学院人体解剖、模拟人体生理反应、在正式手术前模拟演练等,进一步提高了治疗的效率、一定程度上减少了病人的痛苦。

金融行业

当下,金融行业采用数字化技术提高工作效率、改善服务质量的需求旺盛。虚拟数字人应用在金融行业的业务导引、业务办理、营销及远程虚拟客服等服务场景,为消费者提供了个性化、智能化的服务。

通过虚拟数字人进行服务导引,不仅能帮助工作人员分担客流压力,还能保证服务的标准规范,保证服务质量;业务办理环节,虚拟数字人生动形象地指导用户更便捷地完成操作,并结合机器视觉识别加强风控,减少冒充身份办理业务等情况的出现;虚拟数字人还提供了更佳的人机交互体验,在营销过程中更人性化地介绍产品和服务,减少用户的抵触情绪;远程虚拟客服智能化地解答问题、身份认证、加强风控,让客户享受到便捷、人性化的服务。

文旅行业

虚拟数字人导游已越来越多地出现在旅游景点、博物馆等场景中,“TA们”不仅解决了导游人手不足的问题,还提供了全面、准确、生动的讲解服务,配合VR/AR/全息等技术增强旅游消费的沉浸感,虚拟与现实交融之中让游客更好地感受人文、历史和自然风景,获得更好的文化消费体验。

教育行业

虚拟数字人扮演的AI虚拟老师通过在线教学,可与学生24小时在线交流,随时随地解答学生提出的问题,这一模式不仅更好地提升了教学效率,还充分地保护了视频教学中的个人隐私。运用计算机视觉进行情绪识别、手势识别可为在线教学进一步赋能。例如,情绪识别可帮助判断孩子的听课效果。孩子出现困惑的表情时,将这一情绪及时反馈给AI虚拟老师,AI虚拟老师就会再次讲解知识点,从而帮助孩子更好地学习和理解。

电商行业

虚拟数字人可以替代真人主播实现7×24小时不间断直播,有效解决了主播人员不足、人力成本逐渐攀升的问题。此前,虚拟数字人的生成门槛较高、成本较高,且后续的交付使用也存在一定难度,因此只有少数头部商家会选择用虚拟数字人替代真人进行短视频拍摄、电商直播。随着技术的不断完善,更多低成本、标准化、智能化的解决方案和产品出现,受众用户群体大幅增加。

目前,以真人形象为基础的2D超写实虚拟数字人的制作、运营成本已经降到较低的水平,和人工成本逐渐拉开差距。以硅基智能平台提供的服务为例,虚拟数字人形象+声音克隆的费用为几万元/年;虚拟数字人如果用于拍摄短视频, 只需要支付大约几十元/分钟的时长费;如果用于直播带货,需要再支付几千元/月的服务费。

随着AIGC技术的不断进步,虚拟数字人和用户在直播间的交互能力得到进一步提升,直播间的转化效果和真人主播直播间进一步缩小差距。

虚拟数字人行业迅速升温,各式各样的虚拟数字人频繁地出现在公众视野中。对此,中央财经大学中国互联网经济研究院副院长欧阳日辉认为,虚拟数字人的使用,应该不应局限于服务行业,要更多运用于生产领域,从而推动实体经济的发展。随着虚拟数字人的技术使用成本逐渐降低,相关制度逐渐完善,希望虚拟数字人在第一产业农业和第二产业工业中,不管是在生产领域、销售领域,还是售后服务领域,能够更多地发挥作用。

清华大学新闻与传播学院教授沈阳表示,机器学习、深度学习和语义理解等技术取得突破、3D成像传感器日益成熟、算力提高与通信速度加快,都为虚拟数字人的发展质量提供了技术保障。

与此同时,《新一代人工智能发展规划》等多项政策,也加速了虚拟数字人底层技术的发展。其中,《广播电视和网络视听“十四五”科技发展规划》明确提出,要推动虚拟主播、动画手语广泛应用于新闻播报、天气预报、综艺科教等节目生产,创新节目形态,提高制播效率和智能化水平。

从“昨天”的娱乐、代言,到“今天”的医疗、金融、文旅、教育、公共服务,随着技术进步和场景拓展,虚拟数字人走入千行百业,在虚拟空间中推动着社会生产力的变革。

三、破局规模化落地 推动虚拟与现实走向融合

并不遥远的“昨天”,虚拟数字人是“Z世代”和品牌方眼中的“完美偶像”,但这同时也表明,此时虚拟数字人的应用场景尚处于相对狭窄的范围内,基本没能跳出娱乐、偶像、代言人等领域。

未来,人类或将迎来人机共存、人机互动的时代,虚拟数字人将更加高频次地出现在大众身边,让虚拟数字人更好地服务于人类将是发展的宗旨。“真实” “互动”“智能”将是虚拟数字人研究和发展的重点。

要判别是否是“人”,外形至关重要。因此,在未来,虚拟数字人的“可视性”仍面临巨大挑战。基于生物解剖、计算机视觉、计算机图形学等跨学科研究,通过对真实的人的外形解构,再在虚拟世界中进行还原,构建模型并通过合适的显示手段展示,无限逼近真实人类的外形将是持续存在的需求。

虚拟数字人与人的交互,将开启人类认识世界的新方式。虚拟数字人要像人类一样能对外界刺激给出回应,对肢体、语言、表情的研究仍需深入,才能保证真实自然的体验;与VR、AR、全息技术的结合,探索更真实、更舒服的交互方式,让人机协同带来更多可能。

AI与虚拟数字人的深度结合将成为长期趋势。AI可为虚拟数字人注入灵魂、赋予大脑,让虚拟数字人具备类似人类的“智能”,具备思考和学习的能力,将让虚拟数字人适用于更多的场景,完成更复杂的任务,更好地服务于人类。

现有的虚拟数字人的应用场景仍将继续存在,但服务的方式会升级,更真实、更智能、互动性更强;还有更多场景将被开发出来,目前由人类主导的活动未来几乎都可以由虚拟数字人来完成,人类将被进一步解放。

未来,人类将有可能创造出不止一个数字虚拟世界,既可能是一比一对真实世界的数字孪生,也可能是通过想象创造出的虚拟新世界。人类将不仅在现实世界中以肉身存在,更将在这些虚拟世界中以数字化身的形式存在。每个人都可能拥有至少一个数字化身,拥有创造数字化身的能力将成为对社会基础设施的必然要求。目前,只有好莱坞才能创造的影院级的虚拟数字人,未来,用户可能只需拥有一台电脑或一部手机就可以创造出来……

虚拟数字人的快速发展折射出虚拟世界与现实世界走向融合的大趋势,但从展望回到现实,要想真正实现虚拟数字人的规模化落地还有不小的差距。例如,虚拟主播可随时、随地、定制化播报新闻,体现了AI与媒体行业的深度融合,但综合市场情况来看,产业上游技术端仍较为薄弱,不少企业面临着成本和变现难题。此外,随着资本涌入,企业还不得不面对竞争加剧和政府监管等风险。

对此,百度智能云AI人机交互实验室负责人李士岩体会颇深,其在接受媒体采访时表示,虚拟数字人规模化落地还面临三大难点:产业链割裂、服务场景与演艺场景没有有效打通、满足高频次需求成本高。

首先,虚拟数字人产业链各个节点相对独立,不能高效协同,导致虚拟数字人在制作和调优上存在较高门槛,目前行业中大多数公司只是虚拟数字人制作与运营全流程上的一环或其中几环。

其次,服务场景与演艺场景没有有效打通,表现为演艺型虚拟数字人不具备客户所需的业务能力,而服务型虚拟数字人由于缺乏人设,难以与用户进行情感交流。

最后,满足高机动性、高频次需求的成本依旧很高,这一问题归根结底还是虚拟数字人的生产效率问题。

中国首个原创虚拟学生“华智冰”的研发团队认为,当前,AI正在从感知智能走向认知智能,机器也要从识别语音进化到理解语音,这对虚拟数字人的人机交互体验和场景应用提出更高要求,带来更大挑战。

破局的关键在于深度的场景理解和有效的技术提升,不少科技企业已开始探索。以腾讯云“小微数智人”为例,基于金融、政务、文旅等不同行业需求,可提供多样化的解决方案,如审核面签、理财顾问等角色,每个数智人的能力不同,能更好满足各类业务场景的服务需求。

“我们希望虚拟数字人不仅要有真人交互的情感温度,更要有强大的AI能力。”腾讯智能产品副总裁李学朝表示,要保证最优服务性能,为各行各业输出完整的解决方案,不断渗透到智慧生活的各个场景。

此外,虚拟数字人的行业规范需要尽快确立,否则极有可能引起假冒人物原型进行诈骗等违法犯罪活动。不久前,国外一名23岁的网红,利用AI技术,让自己成为“每一位粉丝的虚拟女友”,同时进行私密语音聊天,每分钟收费1美元。这项服务名为CarynAI,5月初推出内测版本后,不到一周就收获了超过1000名付费用户,创造了7万多美元的收入(约合人民币50万元)——AI上线之后,自主运行,本人即使睡觉都可以“躺着赚钱”。由于虚拟数字人、AI产业的规范仍有空缺,很多从业者也无法判定这门生意的是非对错。

“虚拟数字人看上去与真人高度相似,跟你打视频、通电话,都可能无法分辨。”上海交通大学人工智能治理与法律研究中心秘书长何渊说,未来需要对深度合成的虚拟数字人专门立法。除了政府监管,行业各方还要有合作治理理念,提前防范相关法律伦理道德风险。只有这样,虚拟数字人才能真正成为真实人类的合作伙伴和服务者,而不是竞争对手或危害者。

编后语: 从“昨天”到“今天”,虚拟数字人及其产业的发展已经取得显著成果,技术驱动下,虚拟数字人已经由最初的虚拟偶像逐渐拓展至虚拟助手、虚拟主播,形态日益多元化。但是受制于技术、成本、应用场景等因素的制约,虚拟数字人仍处于初级发展阶段。随着内容呈现方式的不断完善,虚拟数字人会在现代消费主义粉丝文化的浪潮下加速商业化脚步,反哺虚拟数字人的创新与研发,最终形成一个完整的技术与内容生态。对于相关机构而言,拥有文化内涵且差异化显著的虚拟数字人更容易走入大众视野,成为内容市场与营销市场的“宠儿”,而那些形象趋同、内容单一的虚拟形象,最终将会被市场淘汰。

作为虚拟数字人的重要应用平台,短视频平台在积极推动内容层面上的规范。5月9日,《抖音关于人工智能生成内容的平台规范暨行业倡议》发布,针对人工智能生成的视频、图片和衍生的虚拟人直播,首次明确其在平台内的行为规范。平台将提供虚拟人的注册能力,并对已注册的虚拟人形象进行保护。

“明天”,随着大量虚拟数字人登场,势必会引发关于虚拟数字人的知识产权纠纷,虚拟数字人知识产权认证必将成为迫切需求。毫无疑问,虚拟数字人需要有相应的行业标准、技术门槛以及伦理来规范其发展,以保护真实人类的利益和尊严。

无论何时,虚拟数字人都应该是真实世界的补充和延伸,而不是颠覆和替代。(文\中国计算机报 黄哲)

责编:张德会

一审:宁静

二审:詹娉俏

三审:张德会

来源:湖南日报·新湖南客户端

我要问