DeepSeek发布新模型DeepSeek-V3.2及长思考增强版Speciale,性能超越现有开源模型,在推理、智能体等多领域基准测试中表现出色。通过引入DSA稀疏注意力机制、强化学习协议和工具使用场景泛化流程,显著提升长序列处理效率与泛化能力。V3.2系列已开源,并在多个国际竞赛中取得优异成绩,展现了强大的复杂任务处理能力。 来源:36氪