近期,国内AI大模型厂商纷纷宣布“迭代”。3月10日,字节跳动豆包大模型团队官宣开源一项针对MoE架构的关键优化技术,可将大模型训练效率提升1.7倍,成本节省40%。3月6日,阿里巴巴发布并开源全新的推理模型通义千问QwQ-32B,通过强化学习,可在数学推理、代码生成等任务上实现精度提升。