开源和闭源模型的差距在拉大:这是DeepSeek论文揭示的残酷真相

开源和闭源模型的差距在拉大:这是DeepSeek论文揭示的残酷真相

DeepSeek 发布 V3.2 技术报告,指出开源大模型与闭源模型的性能差距在扩大。报告通过对比测试显示,开源模型在复杂任务上明显落后于闭源模型。论文分析了三个关键问题:传统注意力机制效率低、后训练资源投入不足、AI Agent 能力滞后,并提出相应解决方案,包括引入 DSA 机制、增加后训练预算和开发系统化任务合成流程,显著缩小了与闭源模型的差距。

来源:36氪

Back to top button