云知声“声音克隆”来了!四步打造用户专属声音

  新湖南客户端   2023-03-23 20:43:13

随着人工智能产业的日渐成熟,智能语音已然进入了“落地期”。语音唤醒、语音播报、智能语音助手……如今,越来越多的人开始习惯AI语音带来的陪伴与帮助。

那么,在智能语音“飞入寻常百姓家”的当下,AI语音的下一个应用场景会是什么?

近日,在人工智能语音领域深耕多年的云知声上线“声音克隆”服务,赋能APP和智能硬件打造“用户录音并生成播报音色”的功能,让语音助手的声音形象更立体、更亲切、更饱满,让用户在使用智能语音服务时享有更高的可玩性。

“声”入人心,打造个性化语音功能

“声音克隆”,是云知声基于语音合成技术打造的个性化应用,主要适用于产品面向C端客户的企业厂商,以个性化语音助其开拓产品新模式、新空间。

通过“声音克隆”,用户能够以少量的录音进行模型训练,得到与本人非常相似的声音模型,以此为基础,可将任意文本转换为本人的声音,实现个性化语音。

在产品日益同质化的当下,“声音克隆”功能的植入不仅是锦上添花,更将成为提升用户产品体验、培养用户忠诚度的重要一步—— 在“声音克隆”的加持下,智能音箱不再是冰冷的AI,而将以儿女的声音提醒父母注意天气变化,叮嘱他们添衣御寒; 车载导航可以不必是千篇一律的“志玲”或“腾哥”, 妻子、孩子的声音将成为指引用户回家的最佳方向标; 儿童点读机里生硬的机械音也将被妈妈轻柔的呢喃所取代,陪伴宝宝安稳入眠……

声音克隆:始于科技,融于日常

作为以智能语音起家的人工智能企业,云知声语音合成技术在音色还原度、发音准确率、音质清晰度等方面具有明显的行业优势,具备大规模商业化的应用能力。目前已在智能营销、智能家居、智能车载等场景实现落地应用。

基于最新语音合成深度学习技术,云知声“声音克隆”可全面学习用户音色、风格,仅需用户的20句原始录音,即可合成贴近真人的数字声音,且做到音色高保真还原,朗读的语气、语调、情感也堪比真人。

同时,为了使合成发音更具专属发音人特点,“声音克隆”通过端到端声学模型,将输入的文本转换成声学参数,然后通过神经网络声码器将声学参数转换成语音,合成效果具有更高的自然度、辨识度,实现真实还原个人音色,实现有温度、有感情、零距离感的真实分享。

只需四步,克隆你的专属声音

作为一款聚焦C端用户个性化需求的B端产品,“声音克隆”充分考虑C端用户行为偏好,在功能设置更简洁、更便捷、更快速。厂商只需将其集成在APP、智能硬件等智能产品上,用户四步即可复刻出自己的声音。

目前,云知声已上线“声音克隆”小程序——云知声智能语音体验馆,只需四步,即可克隆你的专属声音。(注:每个账号仅有1次克隆次数)

具体步骤为:第一步,环境检测。同意授权使用麦克风后,确保环境安静,无嘈杂干扰;第二步,录制20句文本。保持与手机耳机麦克风保持1-2个拳头距离以内,用声音平稳、吐字清晰、语速适中的普通话读出屏幕上的文本;第三步,等待声音训练完成。最快20分钟,即可克隆好你的声音;第四步,查看和试听。可在“个人中心-我的声音”中输入文本或选择随机文本,即可播放并分享相应的音频。

据介绍,云知声希望通过“声音克隆”,赋予更多APP和智能硬件更具可玩性的智能语音服务,打造产品差异化,提升产品丰富度与用户参与感,塑造全新用户体验。

同时,在天翼云电脑助力下,千行百业正在数字化转型的道路加速前行。而位于上海建设中的云电脑专属资源池投入使用后,天翼云服务能力和业务承载能力将再上新台阶,同时面对办公多终端和多场景的趋势,天翼云也做好了拓展更多场景应用、创造更多普惠应用价值的准备,将全力促进用户共享数字经济发展红利。(通讯员 谭心怡)

责编:张云龙

一审:张云龙

二审:张马良

三审:熊佳斌

来源:新湖南客户端

我要问