Sora是机会还是风险?这场人才沙龙全方位解读AIGC时代的机遇与难题

通讯员 李文淇   湖南日报·新湖南客户端   2024-03-12 09:54:51

湖南日报·新湖南客户端3月12日讯(通讯员 李文淇)“当文生视频成为现实,人类创作者便可从传统的构建素材过程中脱离出来,利用Sora这样的工具更快拿到素材结果并进行继续创作,因此对业内人士而言,Sora是一个礼物,并且未来在智能驾驶、游戏领域将有更多出乎意料的可能性。”

3月11日下午,岳麓山大学科技城第93期人才沙龙之科创圆桌派上,湖南师范大学信息科学与工程学院人工智能系副教授江沸菠以及万兴科技AI创新中心副总经理作为访谈嘉宾,共同围绕近期发布的Sora展开AIGC畅想,并就Sora的细分领域应用以及对人类岗位的影响速度展开热烈讨论。

今年2月16日,由OpenAI推出的视频生成模型Sora公布24个文字生成视频案例,其超出预期的流畅度和视频生成长度成功刷新世界“技术观”,国际各界反响不一。

江沸菠介绍,Sora目前依托的底层技术有三类:首先是Diffusion Transformer,也就是人工智能生成模型,由Transformer和扩散模型组成;其次是时空分片技术,即将整个视频分成一个个小块的时空片段,通过重新编排和训练形成后期视频;最后是视频压缩网络技术,将原始视频压缩到一个很小的特征空间里进行处理,提升视频整体生成效率。

对于相关从业者最关心的问题,二位嘉宾都表示Sora及AIGC目前对于专业科研人员的工作没有明显的影响,但对于影视行业创作者:美术师、摄影师、剪辑师、短剧甚至长剧创作者而言,也许会有替代原有生产方式的可能。

就整体而言,二位人工智能从业者都表示,Sora对于行业的整体影响是利大于弊的。但最终融入平常百姓的生活中去,还需要在细分领域继续深挖,并通过更低能耗、更高算力的硬件来落地它。例如前段时间较火的头戴数字交互设备Vision Pro就是一个“高开低走”的典型。
   万兴科技AI创新中心副总经理甘伟豪认为,Vision Pro等产品在舒适度、自然度、续航性上还未达到人们的期待,这些硬件上的瓶颈需要在物理世界层面有更大的突破,而Sora对应的软件是处于数字世界的,即0和1组成的一系列比特位。无疑物理世界是更加复杂的,涉及物理、化学等多个自然科学,因此硬件配套要跟上AIGC的进步,还需要耐心等待。

当聊到Sora目前存在的局限性和短板,甘伟豪表示,Sora根据提示语言生成的结果一致性是有待验证的,例如同样一个提示词,在反复提问或者已生成视频基础上希望修改视频中的某个物体,Sora可能得出完全不同的理解,由此创作者的工作流便会出现被动断层的可能。

湖南师范大学人工智能系副教授江沸菠补充道:“Sora的诞生也可能会导致仿制、虚假内容过多的现象,这样的情况需要从模型的设计者以及创作者双方来共同维护,同时未来也可能会出现专注识别和清理人工智能垃圾视频的公司来解决这一问题。”

AIGC行业将有望迎来更多人才的流入,两位来自高校及企业的专家在人才培养方面一致认为,工程思维、产品应用思维及实践能力将是决定人才在行业内能否具备更高岗位价值的关键。

据了解,大科城人才沙龙自2021年3月启动以来,通过录播式圆桌访谈、沉浸式互动交流的方式,邀请重点高校学科教授以及企业资深技术官围绕AIGC、新能源、智能制造等高科技领域的行业前景、发展痛点、人才培养等热门话题的讨论。截至目前,累计超3000人次参与人才沙龙,线上视频浏览量超100万人次。

责编:王宇蓝

一审:范远志

二审:王晗

三审:周韬

来源:湖南日报·新湖南客户端

我要问