【AI 核心摘要】
火山引擎正式发布豆包音频生成模型1.0,首次支持文本与音频多模态输入,端到端生成目标音频,实现全要素创作。该模型能在长时生成中保持多角色音色一致性,减少后期修音;用户可通过单条Prompt编排对白、情绪、音乐等,直接产出成片级音频作品,颠覆传统分轨制作流程。模型支持0样本生成与音色风格解耦控制,适用于有声书、播客等场景。即日起开启API邀测,个人用户可体验30分钟创作额度,并即将上线剪映等产品。
了解更多详细信息,请访问原文:火山引擎推出音频创作模型「豆包音频生成模型1.0」
数据来源:AI Bot
© 版权声明
文章版权归作者所有,未经允许请勿转载。

