OpenAI 推出声音克隆产品

huangzuomin (74)in #cn • last month

近日，OpenAI 展示了名为 Voice Engine 的模型预览版，这是一种革命性的模型，能够仅凭 15 秒的音频样本复制人声，并生成听起来非常自然的语音。这一技术的潜能及其对未来的影响不可小觑。

Voice Engine 的最大亮点在于其能够在生成语音时保留原始说话者的口音和情感，这一点在目前的技术中极为罕见。它的运作原理和技术细节尽管被笼罩在一定的神秘色彩中，但从 OpenAI 公开的信息中不难看出，这项技术已经达到了令人瞩目的水平。

目前，Voice Engine 正在经过一小批精心挑选的合作伙伴的测试阶段，其中就包括位于人工智能创新前沿的企业 HeyGen。OpenAI 对于这项技术的安全性十分重视，已经实施了包括音频水印和前瞻性监控等多项措施，以防止可能的技术滥用情况发生。

OpenAI 透露，这项突破性技术的研发始于 2022 年底，此后便一直在为公司的文本到语音 API 以及 ChatGPT 提供声音支持。Voice Engine 的内部部署不仅是 OpenAI 技术进步的证明，更是该公司在人工智能领域深思熟虑、负责任的态度的体现。

OpenAI 明显在语音合成技术领域遥遥领先，Voice Engine 的成功展示再次证明了这一点。然而，考虑到技术可能被用于制造选举年的深伪技术骗局等风险，OpenAI 显示出了其对新技术潜在社会影响的深刻理解和高度负责的态度，目前还没有计划对外公开发布这项技术。

着人工智能技术的不断进步，如何平衡创新与责任，将是所有 AI 研究者和开发者不得不面对的重要课题。OpenAI 通过 Voice Engine 展示了一种可能的路径，即在技术大步前行的同时，不忘后顾之忧，审慎地考量每一步的走向。

last month in #cn by huangzuomin (74)

Sort:

jswit (65) last month

Upvoted! Thank you for supporting witness @jswit.

$0.00

STEEM 0.31

TRX 0.12

JST 0.032

BTC 57810.33

ETH 2939.11

USDT 1.00

SBD 3.70