云知声“声音克隆”来了！四步打造用户专属声音

新湖南客户端 2023-03-23 20:44:26

随着人工智能产业的日渐成熟，智能语音已然进入了“落地期”。语音唤醒、语音播报、智能语音助手……如今，越来越多的人开始习惯AI语音带来的陪伴与帮助。

那么，在智能语音“飞入寻常百姓家”的当下，AI语音的下一个应用场景会是什么？

近日，在人工智能语音领域深耕多年的云知声上线“声音克隆”服务，赋能APP和智能硬件打造“用户录音并生成播报音色”的功能，让语音助手的声音形象更立体、更亲切、更饱满，让用户在使用智能语音服务时享有更高的可玩性。

“声”入人心，打造个性化语音功能

“声音克隆”，是云知声基于语音合成技术打造的个性化应用，主要适用于产品面向C端客户的企业厂商，以个性化语音助其开拓产品新模式、新空间。

通过“声音克隆”，用户能够以少量的录音进行模型训练，得到与本人非常相似的声音模型，以此为基础，可将任意文本转换为本人的声音，实现个性化语音。

在产品日益同质化的当下，“声音克隆”功能的植入不仅是锦上添花，更将成为提升用户产品体验、培养用户忠诚度的重要一步——在“声音克隆”的加持下，智能音箱不再是冰冷的AI，而将以儿女的声音提醒父母注意天气变化，叮嘱他们添衣御寒；车载导航可以不必是千篇一律的“志玲”或“腾哥”，妻子、孩子的声音将成为指引用户回家的最佳方向标；儿童点读机里生硬的机械音也将被妈妈轻柔的呢喃所取代，陪伴宝宝安稳入眠……

声音克隆：始于科技，融于日常

作为以智能语音起家的人工智能企业，云知声语音合成技术在音色还原度、发音准确率、音质清晰度等方面具有明显的行业优势，具备大规模商业化的应用能力。目前已在智能营销、智能家居、智能车载等场景实现落地应用。

基于最新语音合成深度学习技术，云知声“声音克隆”可全面学习用户音色、风格，仅需用户的20句原始录音，即可合成贴近真人的数字声音，且做到音色高保真还原，朗读的语气、语调、情感也堪比真人。

同时，为了使合成发音更具专属发音人特点，“声音克隆”通过端到端声学模型，将输入的文本转换成声学参数，然后通过神经网络声码器将声学参数转换成语音，合成效果具有更高的自然度、辨识度，实现真实还原个人音色，实现有温度、有感情、零距离感的真实分享。

只需四步，克隆你的专属声音

作为一款聚焦C端用户个性化需求的B端产品，“声音克隆”充分考虑C端用户行为偏好，在功能设置更简洁、更便捷、更快速。厂商只需将其集成在APP、智能硬件等智能产品上，用户四步即可复刻出自己的声音。

目前，云知声已上线“声音克隆”小程序——云知声智能语音体验馆，只需四步，即可克隆你的专属声音。（注：每个账号仅有1次克隆次数）

具体步骤为：第一步，环境检测。同意授权使用麦克风后，确保环境安静，无嘈杂干扰；第二步，录制20句文本。保持与手机耳机麦克风保持1-2个拳头距离以内，用声音平稳、吐字清晰、语速适中的普通话读出屏幕上的文本；第三步，等待声音训练完成。最快20分钟，即可克隆好你的声音；第四步，查看和试听。可在“个人中心-我的声音”中输入文本或选择随机文本，即可播放并分享相应的音频。

据介绍，云知声希望通过“声音克隆”，赋予更多APP和智能硬件更具可玩性的智能语音服务，打造产品差异化，提升产品丰富度与用户参与感，塑造全新用户体验。

同时，在天翼云电脑助力下，千行百业正在数字化转型的道路加速前行。而位于上海建设中的云电脑专属资源池投入使用后，天翼云服务能力和业务承载能力将再上新台阶，同时面对办公多终端和多场景的趋势，天翼云也做好了拓展更多场景应用、创造更多普惠应用价值的准备，将全力促进用户共享数字经济发展红利。（通讯员谭心怡）

责编：张云龙

一审：张云龙

二审：张马良

三审：熊佳斌

来源：新湖南客户端

我要问