腾讯混元推出全球首个产业级2Bit端侧量化模型HY-1.8B-2Bit,专为消费级硬件设计。该模型通过量化感知训练技术,将等效参数量压缩至0.3B,内存占用仅600MB,比原始模型缩小6倍。在保持与4比特模型相当性能的同时,其在手机等设备上的生成速度提升2-3倍,首字延迟大幅降低。模型支持灵活思维链模式,并已完成Arm等平台适配,可在移动设备高效运行。这一突破为离线、高私密性的端侧AI应用提供了“小而强”的解决方案,推动大模型在边缘计算场景的落地。
© 版权声明
文章版权归作者所有,未经允许请勿转载。

