微软开源 rStar2 – Agent 框架,140 亿参数 AI 模型多领域性能突破行业标杆
微软最近发布开源 AI 智能体推理框架 rStar2 – Agent,其参数规模仅为 DeepSeek – R1 的 0.2%,却以 80.6% 的数学推理准确率刷新纪录,在科学推理和工具调用测试中超越现有标杆。该框架有三大技术革新,包括隔离式代码执行架构、GRPO – RoC 算法和高效训练流程。项目已在 GitHub 开源,加速智能体技术产业化落地。(AIbase)
本文来自投稿,不代表DEVCN立场,如若转载,请注明出处:https://devcn.xin/5929.html