DeepSeek 发布了两款新模型 V3.2 和 V3.2-Speciale,分别在推理能力和工具调用方面取得突破。V3.2 引入稀疏注意力机制 DSA,显著提升了处理长文档的效率和性能;同时通过强化学习训练框架,实现了边思考边使用工具的能力,适用于日常问答、写作等场景。V3.2-Speciale 则面向高级任务,性能媲美 Gemini-3.0-Pro,但在成本和实用性上有所妥协。 来源:36氪