近日消息,阶跃星辰开源 Agent 基座模型 Step 3.5 Flash 上线仅两天成功登顶 OpenRouter 平台 Trending 榜单。该榜单排名来自全球知名大模型聚合平台 OpenRouter 数据,数据基于全球开发者与用户的实际模型调用量,直观反映出模型在真实应用场景中的受欢迎程度与市场接受度。
阶跃星辰 Step 3.5 Flash 荣登 OpenRouter Trending 榜首,不仅验证了该模型作为技术黑马在高吞吐与复杂推理场景下的强劲实力,更彰显了其作为兼具极致性能与稳定性的实战首选地位作为面向实时 Agent 工作流场景的模型,Step 3.5 Flash 在推理效率上表现突出,最高推理速度可达每秒 350 个 token。该模型款稀疏混合专家(MoE)架构,在保持较为精巧的1960总参数量的同时,每个 token 在处理过程中仅需激活约 110 亿个参数,在保障模型性能的同时实现运行效率的优化,从而弥合前沿级智能体智能与计算效率之间的鸿沟。
在官方发布的Step 3.5 Flash Tech Report里显示,该模型聚焦于构建智能体的精准推理能⼒以及快速可靠的执行效率。Step 3.5 Flash 通过交错的 3:1 滑动窗口/全注意力机制(Sliding Window/Full Attention)和多 Token 预测(MTP-3)进行优化,以最小化多轮智能体交互的延迟和成本。为实现前沿级智能,Step 3.5 Flash 还采用了可扩展的强化学习(RL)框架,推动模型在数学、代码和⼯具使用等领域持续自我提升。
Step 3.5 Flash 在智能体、编码和数学任务中展现出卓越性能:在 IMO-AnswerBench 上达到 85.4% 的准确率,在 LiveCodeBench-v6(2024.08‒2025.05)上达到 86.4%,在 τ2-Bench 上达到 88.2%,在 BrowseComp(含上下文管理)上达到 69.0%,在 Terminal-Bench 2.0 上达到 51.0%——其性能与 GPT-5.2 xHigh、Gemini 3.0 Pro 等前沿模型相当。通过重新定义效率边界,Step 3.5 Flash 为在真实工业环境中部署复杂智能体提供了高密度基础。Step3.5Flash 仅1960亿总参数、110亿激活参数,就能做到与前沿“巨模”在推理能力、智能体能力上性能相当。
上图:Step 3.5 Flash 仅需 110 亿激活参数(1960 亿 MoE 总参数)即可实现前沿级智能,性能比肩主流闭源和开源模型。
打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。
商业时报Business Times(商业报告网)提供深度的商业趋势分析、市场洞察、行业深度研究以及全球市场分析,所转载的数据及图文内容来自于互联网,仅用于学习交流,所有版权归原作者或原发布平台所有。商业时报不涉及任何形式的商业广告,所有转载内容仅作为参考和学习资料,本站不会因此获利。商业时报并非新闻媒体,不提供互联网新闻采编相关服务。如有任何不实之处、涉及版权问题,请联系邮箱:Jubao_Times@163.com
商业时报所刊载信息均来源于网络,并不代表本站观点。本文所涉及的信息、数据和分析均来自公开渠道,如有任何不实之处、涉及版权问题,请邮箱Jubao_Times@163.com
本文仅供读者参考,任何人不得将本文用于非法用途,由此产生的法律后果由使用者自负
渝公网安备 50010602503706 号