OpenAI 推出声音克隆产品

in #cnlast month

image.png

近日,OpenAI 展示了名为 Voice Engine 的模型预览版,这是一种革命性的模型,能够仅凭 15 秒的音频样本复制人声,并生成听起来非常自然的语音。这一技术的潜能及其对未来的影响不可小觑。

Voice Engine 的最大亮点在于其能够在生成语音时保留原始说话者的口音和情感,这一点在目前的技术中极为罕见。它的运作原理和技术细节尽管被笼罩在一定的神秘色彩中,但从 OpenAI 公开的信息中不难看出,这项技术已经达到了令人瞩目的水平。

目前,Voice Engine 正在经过一小批精心挑选的合作伙伴的测试阶段,其中就包括位于人工智能创新前沿的企业 HeyGen。OpenAI 对于这项技术的安全性十分重视,已经实施了包括音频水印和前瞻性监控等多项措施,以防止可能的技术滥用情况发生。

OpenAI 透露,这项突破性技术的研发始于 2022 年底,此后便一直在为公司的文本到语音 API 以及 ChatGPT 提供声音支持。Voice Engine 的内部部署不仅是 OpenAI 技术进步的证明,更是该公司在人工智能领域深思熟虑、负责任的态度的体现。

OpenAI 明显在语音合成技术领域遥遥领先,Voice Engine 的成功展示再次证明了这一点。然而,考虑到技术可能被用于制造选举年的深伪技术骗局等风险,OpenAI 显示出了其对新技术潜在社会影响的深刻理解和高度负责的态度,目前还没有计划对外公开发布这项技术。

着人工智能技术的不断进步,如何平衡创新与责任,将是所有 AI 研究者和开发者不得不面对的重要课题。OpenAI 通过 Voice Engine 展示了一种可能的路径,即在技术大步前行的同时,不忘后顾之忧,审慎地考量每一步的走向。

示例:https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices

Sort:  

Upvoted! Thank you for supporting witness @jswit.

Coin Marketplace

STEEM 0.31
TRX 0.12
JST 0.032
BTC 57810.33
ETH 2939.11
USDT 1.00
SBD 3.70