火山引擎推出音频创作模型「豆包音频生成模型1.0」

【AI 核心摘要】

火山引擎正式发布豆包音频生成模型1.0，首次支持文本与音频多模态输入，端到端生成目标音频，实现全要素创作。该模型能在长时生成中保持多角色音色一致性，减少后期修音；用户可通过单条Prompt编排对白、情绪、音乐等，直接产出成片级音频作品，颠覆传统分轨制作流程。模型支持0样本生成与音色风格解耦控制，适用于有声书、播客等场景。即日起开启API邀测，个人用户可体验30分钟创作额度，并即将上线剪映等产品。

了解更多详细信息，请访问原文：火山引擎推出音频创作模型「豆包音频生成模型1.0」

数据来源：AI Bot

文章版权声明 1 本网站名称：凉西西小圈
2 本站永久网址：https://www.xcxybbs.cn
3 本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系站长 QQ418005852进行删除处理。
4 本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5 本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报
6 本站资源大多存储在云盘，如发现链接失效，请联系我们我们会第一时间更新。

文章版权归作者所有，未经允许请勿转载。