DeepSeek-R1 开创历史，梁文锋论文登上《自然》封面

DEV编辑 • 2025年9月18日下午9:24 • 资讯 • 阅读 10

DeepSeek 团队共同完成、梁文锋担任通讯作者的 DeepSeek-R1 推理模型研究论文登上《自然（Nature）》封面。与初版论文相比，本次披露更多模型训练细节，回应蒸馏质疑。Nature 称 DeepSeek 打破主流大模型未经独立同行评审的空白。研究表明，大语言模型（LLM）的推理能力可通过纯强化学习来提升，从而减少增强性能所需的人类输入工作量。训练出的模型在数学、编程竞赛和STEM领域研究生水平问题等任务上，比传统训练的LLM表现更好。

论文原文地址：https://static-content.springer.com/esm/art%3A10.1038%2Fs41586-025-09422-z/MediaObjects/41586_2025_9422_MOESM1_ESM.pdf

原创文章，作者：DEV编辑，如若转载，请注明出处：https://devcn.xin/5968.html

DeepSeek-R1 开创历史，梁文锋论文登上《自然》封面

相关新闻