DeepSeek做Agent，我愿意等

700亿融资、ACM金牌大神带队、招聘JD点名Claude Code——DeepSeek的Agent产品呼之欲出。从API用户的角度说说，为什么这件事值得期待。

DeepSeek这周的消息密度有点高：700亿融资谈判接近尾声，ACM金牌大神崔添翼挂帅新团队，招聘JD直接点名Claude Code和Cursor——对，它要做自己的Agent了。

各种AI的API我都在用，但代码相关的活，我基本都交给DeepSeek。不是偏心，是它确实让人放心——不限调用、不随便封号、价格压到了同行几分之一，输出还稳定靠谱。这种”干活实在”的感觉，是用了其他模型之后对比出来的。所以当DeepSeek说要自己做Agent的时候，我挺兴奋的。不是因为融了多少钱，而是因为做这件事的是DeepSeek。

先说为什么是DeepSeek

DeepSeek还没出名的时候，我就在用它的API了。

那时候它还不叫”国产之光”，也没有全球热搜，就是一个安安静静提供API的小团队。但用着用着你就发现了：每次更新都有实实在在的东西，不搞花活，不画大饼。V3用2000张GPU训出来的模型，跑分超过GPT-4o。R1出来的时候，全世界都在讨论它的训练成本——557万美元，别人花几亿做的事，它零头就做到了。

到现在V4预览版上了1M上下文，内部评测说Agentic Coding能力已经超过Claude Sonnet 4.5。我自己的体感也差不多——DeepSeek的模型在代码能力上，确实够硬。

现在它说要做编程Agent了。Model + Harness = Agent，这是他们招聘JD里的原话。Harness这个概念最近半年被讨论了很多，简单说就是给大模型套一层”壳”——让它能读写文件、执行代码、调用工具、管理上下文，把裸模型的智力变成一个能真正干活的助手。

Claude Code之所以好用，不全是Claude模型本身多强，而是Anthropic在Harness这一层做得扎实。模型决定智商上限，Harness决定能不能把智商兑现成活。

ACM金牌大神带队

DeepSeek找来了崔添翼负责Harness团队。

这个人挺有意思：浙大计算机系，本科期间6次拿下ACM国际大学生程序设计竞赛亚洲区金牌。毕业后去Jane Street——全球顶级量化交易公司，在量化圈差不多就是”哈佛”级别的存在——干了9年。后来联合创立TSY Capital，团队成员人均5枚ACM级别金牌。

3月加入DeepSeek。跟梁文锋一样浙大出身，也一样从量化赛道走来。

DeepSeek资深研究员陈德里在社交媒体上直接说了：“简单来说就是对标Claude Code，做DeepSeek Code Harness。”

招聘JD里的要求更直白：产品经理岗位明确写了要”深度使用过Claude Code、Codex、Cursor、GitHub Copilot、Manus等产品”——不是”了解”，是”深度使用”并且”融入到工作和生活中”。

这说明DeepSeek不是在追热点。它要找的是自己就在用这些工具的人，因为他们最清楚哪里好用、哪里别扭、哪里还有空间。

700亿是什么信号

700亿融资是这周消息量最大的一个。从4月的”3亿美元”，到5月初的”500亿”，再到5月22日彭博报道”700亿”，一个月里融资额翻了200多倍。

但比数字更重要的是结构：梁文锋个人出资200亿，占40%。

这不是一个缺钱才融资的故事。DeepSeek背后是幻方量化——管理着700多亿资金，2025年收益率56%。梁文锋去年还说”VC的钱是负担”，今年自掏200亿领投，同时引入国家大基金、腾讯等外部资本。

这更像是给内部期权定价。DeepSeek过去两年流失了好几位核心研究员，被字节、小米、腾讯用千万年薪甚至上亿总包挖走。200人不到的团队，每走一个核心都意味着整条技术线停顿。没有外部估值锚点，期权就是一张无法兑现的期票。

200亿个人押注的另一个信号是：话语权在我这里。 国家大基金、腾讯可以参与，但梁文锋40%的自有份额天然制约着外部资本的影响力。

从CUDA到昇腾

还有一个容易被忽略的细节：DeepSeek V4正在从英伟达的CUDA生态，全面迁移到华为昇腾的CANN架构。

这不是换个芯片那么简单。底层代码要重写，通信库要换，训练框架要调，MoE架构要重新适配——相当于给一辆高速行驶的汽车换发动机。

前几天MidJourney创始人说了句话，大意是后悔当初用了谷歌TPU来训练，几乎浪费了一年时间。如果再选一次，他会毫不犹豫地选CUDA。连TPU到CUDA的迁移都让顶级团队吃了这么大的亏，DeepSeek从CUDA迁移到昇腾CANN，难度只高不低。

但这件事必须做：H100租约价格半年涨了40%，按需算力全线售罄。阿里、字节、腾讯已经提前下单华为昇腾950，订单规模数十万颗。

昇腾950单卡算力是英伟达H20的2.87倍，而且不受出口管制。DeepSeek V4将是第一个在国产算力上完整验证的一线大模型。

为什么对DeepSeek的预期这么高

说回最开始的话题。

现在AI编程这块，大家用得最多的就是三个：Claude Code、Codex、Cursor。没有一个是中国的。国内Agent产品出了不少，但说实话，跟这三个比还差着段位。尝鲜可以，真拿来做主力开发，差点意思。

更有意思的是，Claude Code、Codex、Cursor这三家，现在也不只是”编程Agent”了——它们都在往通用Agent的方向走。能写代码、能操作文件系统、能调用外部工具、能处理多步任务，编程只是其中一个场景。

这就是为什么DeepSeek说要做Agent，大家的预期会这么高。它要做的不是”中国版Cursor”，而是直接从Agent这个层面入场。

不是因为700亿，不是因为ACM金牌。是因为DeepSeek从还没出名的时候起，就一直是个让人放心的团队。它出手的东西，都是踏实的。 API好用、价格便宜、不限这限那、每次更新都有干货。这种信任不是一天攒出来的，是用出来的。

而且它带了几样别人缺的东西：模型能力已经验证过了（V4代码能力够硬），API定价长期保持激进（Flash版输出2元/百万token），现在又要补上Harness这一层。模型、基础设施、价格，三样凑齐了。

国内能同时凑齐这三样的团队，数不出几个。而DeepSeek恰好是那个最不吭声、但每次出手都让人服气的。

崔添翼带队，招聘JD明确指向桌面端Agent产品。6月V4.1迭代版本要上。

这次它在Agent上的出手，我愿意等。