百度正式开源其文生图模型ERNIE-Image。该模型基于单流DiT架构,参数量仅8B,在消费级显卡(24GB显存)上即可运行,并在多项国际基准测试中达到开源模型的领先水平。ERNIE-Image在复杂指令跟随、文字渲染(支持多语言)和结构化图像生成方面表现突出,覆盖写实、动漫、设计等多种视觉风格。模型权重与推理代码已在Hugging Face等平台开源,并已获得多家企业与创作者平台接入。百度同时宣布启动“文心创作周”系列活动,鼓励用户参与创意生图挑战。
© 版权声明
文章版权归作者所有,未经允许请勿转载。

