2 月 3 日,阿里巴巴 Qwen 团队发布面向编码智能体的开源模型 Qwen3-Coder-Next。该模型采用混合注意力 + 稀疏 MoE 架构,属于 80B.A3B 规格(总参数 80B、推理时仅激活 3B),主打更低推理成本下的高性能。 官方信息显示,其在 SWE-Bench Verified(基于 SWE-Agent scaffold)上取得 70%+ 表现,并针对长程推理、复杂工具调用与失败恢复等智能体能力做了规模化训练;同时支持超长上下文(约 256K),便于在 IDE/CLI 工作流中落地(如 Cline 等)。
qwen.ai
🍀在花频道 🍵茶馆聊天 📮投稿