700亿融资、ACM金牌大神带队、招聘JD点名Claude Code——DeepSeek的Agent产品呼之欲出。从API用户的角度说说,为什么这件事值得期待。

DeepSeek这周的消息密度有点高:700亿融资谈判接近尾声,ACM金牌大神崔添翼挂帅新团队,招聘JD直接点名Claude Code和Cursor——对,它要做自己的Agent了。
各种AI的API我都在用,但代码相关的活,我基本都交给DeepSeek。不是偏心,是它确实让人放心——不限调用、不随便封号、价格压到了同行几分之一,输出还稳定靠谱。这种”干活实在”的感觉,是用了其他模型之后对比出来的。所以当DeepSeek说要自己做Agent的时候,我挺兴奋的。不是因为融了多少钱,而是因为做这件事的是DeepSeek。

先说为什么是DeepSeek
DeepSeek还没出名的时候,我就在用它的API了。
那时候它还不叫”国产之光”,也没有全球热搜,就是一个安安静静提供API的小团队。但用着用着你就发现了:每次更新都有实实在在的东西,不搞花活,不画大饼。V3用2000张GPU训出来的模型,跑分超过GPT-4o。R1出来的时候,全世界都在讨论它的训练成本——557万美元,别人花几亿做的事,它零头就做到了。
到现在V4预览版上了1M上下文,内部评测说Agentic Coding能力已经超过Claude Sonnet 4.5。我自己的体感也差不多——DeepSeek的模型在代码能力上,确实够硬。
现在它说要做编程Agent了。Model + Harness = Agent,这是他们招聘JD里的原话。Harness这个概念最近半年被讨论了很多,简单说就是给大模型套一层”壳”——让它能读写文件、执行代码、调用工具、管理上下文,把裸模型的智力变成一个能真正干活的助手。
Claude Code之所以好用,不全是Claude模型本身多强,而是Anthropic在Harness这一层做得扎实。模型决定智商上限,Harness决定能不能把智商兑现成活。

ACM金牌大神带队
DeepSeek找来了崔添翼负责Harness团队。
这个人挺有意思:浙大计算机系,本科期间6次拿下ACM国际大学生程序设计竞赛亚洲区金牌。毕业后去Jane Street——全球顶级量化交易公司,在量化圈差不多就是”哈佛”级别的存在——干了9年。后来联合创立TSY Capital,团队成员人均5枚ACM级别金牌。
3月加入DeepSeek。跟梁文锋一样浙大出身,也一样从量化赛道走来。
DeepSeek资深研究员陈德里在社交媒体上直接说了:“简单来说就是对标Claude Code,做DeepSeek Code Harness。”
招聘JD里的要求更直白:产品经理岗位明确写了要”深度使用过Claude Code、Codex、Cursor、GitHub Copilot、Manus等产品”——不是”了解”,是”深度使用”并且”融入到工作和生活中”。
这说明DeepSeek不是在追热点。它要找的是自己就在用这些工具的人,因为他们最清楚哪里好用、哪里别扭、哪里还有空间。
700亿是什么信号
700亿融资是这周消息量最大的一个。从4月的”3亿美元”,到5月初的”500亿”,再到5月22日彭博报道”700亿”,一个月里融资额翻了200多倍。
但比数字更重要的是结构:梁文锋个人出资200亿,占40%。
这不是一个缺钱才融资的故事。DeepSeek背后是幻方量化——管理着700多亿资金,2025年收益率56%。梁文锋去年还说”VC的钱是负担”,今年自掏200亿领投,同时引入国家大基金、腾讯等外部资本。
这更像是给内部期权定价。DeepSeek过去两年流失了好几位核心研究员,被字节、小米、腾讯用千万年薪甚至上亿总包挖走。200人不到的团队,每走一个核心都意味着整条技术线停顿。没有外部估值锚点,期权就是一张无法兑现的期票。
200亿个人押注的另一个信号是:话语权在我这里。 国家大基金、腾讯可以参与,但梁文锋40%的自有份额天然制约着外部资本的影响力。
从CUDA到昇腾
还有一个容易被忽略的细节:DeepSeek V4正在从英伟达的CUDA生态,全面迁移到华为昇腾的CANN架构。
这不是换个芯片那么简单。底层代码要重写,通信库要换,训练框架要调,MoE架构要重新适配——相当于给一辆高速行驶的汽车换发动机。
前几天MidJourney创始人说了句话,大意是后悔当初用了谷歌TPU来训练,几乎浪费了一年时间。如果再选一次,他会毫不犹豫地选CUDA。连TPU到CUDA的迁移都让顶级团队吃了这么大的亏,DeepSeek从CUDA迁移到昇腾CANN,难度只高不低。
但这件事必须做:H100租约价格半年涨了40%,按需算力全线售罄。阿里、字节、腾讯已经提前下单华为昇腾950,订单规模数十万颗。
昇腾950单卡算力是英伟达H20的2.87倍,而且不受出口管制。DeepSeek V4将是第一个在国产算力上完整验证的一线大模型。

为什么对DeepSeek的预期这么高
说回最开始的话题。
现在AI编程这块,大家用得最多的就是三个:Claude Code、Codex、Cursor。没有一个是中国的。国内Agent产品出了不少,但说实话,跟这三个比还差着段位。尝鲜可以,真拿来做主力开发,差点意思。
更有意思的是,Claude Code、Codex、Cursor这三家,现在也不只是”编程Agent”了——它们都在往通用Agent的方向走。能写代码、能操作文件系统、能调用外部工具、能处理多步任务,编程只是其中一个场景。
这就是为什么DeepSeek说要做Agent,大家的预期会这么高。它要做的不是”中国版Cursor”,而是直接从Agent这个层面入场。
不是因为700亿,不是因为ACM金牌。是因为DeepSeek从还没出名的时候起,就一直是个让人放心的团队。它出手的东西,都是踏实的。 API好用、价格便宜、不限这限那、每次更新都有干货。这种信任不是一天攒出来的,是用出来的。
而且它带了几样别人缺的东西:模型能力已经验证过了(V4代码能力够硬),API定价长期保持激进(Flash版输出2元/百万token),现在又要补上Harness这一层。模型、基础设施、价格,三样凑齐了。

国内能同时凑齐这三样的团队,数不出几个。而DeepSeek恰好是那个最不吭声、但每次出手都让人服气的。
崔添翼带队,招聘JD明确指向桌面端Agent产品。6月V4.1迭代版本要上。
这次它在Agent上的出手,我愿意等。