DeepSeek V3.2 节前突发,开发者调用 API 成本大幅降低 50%
9 月 29 日,Hugging Face 上突然出现了 DeepSeek V3.2 的踪迹,诸多开发者纷纷猜测,DeepSeek 是否要上新模型了?不久后 DeepSeek 官方就正式宣告了 DeepSeek V3.2-Exp 的到来,并特别注明“这是一个实验性(Experimental)的版本”,其最大亮点有两个:
1)在 DeepSeek V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(DSA,一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。其首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。
2)对开发者的极大利好:API 大幅降价,DeepSeek 官方表示,开发者调用 DeepSeek API 的成本将降低 50% 以上。
原创文章,作者:网站编辑,如若转载,请注明出处:https://devcn.xin/6147.html