DeepSeek-R1 开创历史,梁文锋论文登上《自然》封面
DeepSeek 团队共同完成、梁文锋担任通讯作者的 DeepSeek-R1 推理模型研究论文登上《自然(Nature)》封面。与初版论文相比,本次披露更多模型训练细节,回应蒸馏质疑。Nature 称 DeepSeek 打破主流大模型未经独立同行评审的空白。研究表明,大语言模型(LLM)的推理能力可通过纯强化学习来提升,从而减少增强性能所需的人类输入工作量。训练出的模型在数学、编程竞赛和STEM领域研究生水平问题等任务上,比传统训练的LLM表现更好。
论文原文地址:https://static-content.springer.com/esm/art%3A10.1038%2Fs41586-025-09422-z/MediaObjects/41586_2025_9422_MOESM1_ESM.pdf
原创文章,作者:DEV编辑,如若转载,请注明出处:https://devcn.xin/5968.html