ChatGPT 三周年遭 DeepSeek 暴击，23 页技术报告藏着开源登顶的全部秘密

DeepSeek 发布了两款新模型 V3.2 和 V3.2-Speciale，分别在推理能力和工具调用方面取得突破。V3.2 引入稀疏注意力机制 DSA，显著提升了处理长文档的效率和性能；同时通过强化学习训练框架，实现了边思考边使用工具的能力，适用于日常问答、写作等场景。V3.2-Speciale 则面向高级任务，性能媲美 Gemini-3.0-Pro，但在成本和实用性上有所妥协。

来源：36氪