字节有豆包、有即梦、有Seedance视频生成模型;阿里和腾讯开始把世界模型推到台前;腾讯元宝、阿里千问都在往各自生态里嵌;智谱、MiniMax已经登陆港股,并在二级市场上完成了新的估值重估。 可放在今天的中国AI坐标系里,这个数字已经不再惊人。智谱、MiniMax在港股高点的市值都曾突破3000亿港元,按部分市场口径折算,DeepSeek的百亿美元估值只是它们的一小部分,而月之暗面这样的“小龙”,最新估值已经达到了180亿美元。 DeepSeek过去可以靠技术理想、开源声望和梁文锋的个人号召力凝聚一批人,但当郭达雅在字节获得近亿的年包时,作为DeepSeek员工,能不能用期权分到公司的发展红利,这件事就显得格外重要。 它在模型算法、工程效率、开源路线和降低推理成本上的贡献,仍然是中国AI过去一年最重要的技术事件之一。R1证明了一个小团队也可以用更少资源、更开放路线,做出世界级模型。 DeepSeek曾经是国内AI App增长最快的名字,但到了2025年下半年,豆包已经在月活规模上反超DeepSeek。QuestMobile的报告显示,2025年8月,豆包以约1.57亿月活登上中国原生AI App月活榜首,DeepSeek退居第二。 DeepSeek做过Janus-Pro,也做过DeepSeek-OCR,但它还没有形成一个足够稳定、完整、强势的多模态产物体系。今天的AI竞争越来越强调文本、图像、语音、视频、工具和Agent的统一体验。OpenAI、Google、Anthropic在往这个方向走,国内的字节、阿里、腾讯也在往这个方向走。 阿里发布Happy Oyster,强调可互动、可演绎、可探索的AI数字世界;腾讯发布并开源混元3D世界模型2.0,面向文字、图片、视频输入生成和模拟3D世界。 这些未必立刻变成成熟商业收入,但它们代表了大厂正在把AI能力从聊天框、代码框,往更复杂的空间、视频、游戏和内容生产场景里推。 Seedance 2.0发布后,市场关注点已经不只是“能不能生成一段视频”,而是多镜头、音画同步、叙事节奏、人物动作和生产流程。这些能力一旦和剪映、抖音、电商广告、影视制作连接起来,就会形成DeepSeek目前很难复制的产物闭环。 AI编程正在成为大模型商业化最清晰的场景,开发者会选择效果好、稳定性强的。以OpenClaw为例,几乎没有人会用DeepSeek来养龙虾,因为效果实在是不尽人意。 它在模型效率上仍然有优势,但在App入口、多模态、视频生成、世界模型、Agent、AI编程、公司服务和生态分发上,都被同行拉开了距离。对一家过去以“技术奇迹”被记住的公司来说,这种落差尤其刺眼。 参与早期大模型训练的王炳宣去了腾讯,DeepSeek-OCR核心作者魏浩然离开,DeepSeek-R1核心作者郭达雅去了字节。从幻方时期加入、参与Janus-Pro等多模态工作的阮翀,也在2026年1月官宣加入元戎启行。罗福莉也已加入小米,负责相关AI业务。 它的人才吸引力来自技术挑战、开源声望、研究自由和梁文锋本人。但今天AI行业的人才定价已经完全不同了,顶尖的行业研究员拿到近亿年包已经成为常态。可DeepSeek没办法开出这样的价码。 恒业资本创始合伙人江一表示,公司需要估值定价,因为大厂给人才开的不是单纯现金,而是现金加高估值期权。没有明确估值,DeepSeek很难让员工准确判断自己手里的期权到底对应什么未来。 正如文章开头提到的,如果估值过高,梁文锋自己也要背上更大的增长压力。因此,这一轮融资很可能不只是拿钱,更是给公司定价,给团队定价,也给未来的激励体系定价。 对一个技术理想很强的创始人来说,融资意味着新的股东、新的约束、新的沟通成本,也意味着公司不可能再完全按照研究团队的节奏运转。 如果DeepSeek希望继续留住最顶尖的人,它就必须让团队成员看到可兑现的未来。不能只要求他们相信模型会越来越强,也要让他们相信,公司越来越值钱的时候,自己也能分到那部分发展红利。 2026年3月底,DeepSeek经历了长达11小时的宕机,这次宕机甚至登上热搜。模型能力再强,只要它面向海量用户和开发者提供服务,就必须接受商业化检验。服务器不稳,最简单、最直接的方法就是花钱买更多服务器,购买更多算力和冗余资源,建设更强的云服务与运维体系。 但在高峰流量面前,很多问题最后仍然会落回资金投入。用户不会因为一家公司的训练故事足够漂亮,就能长期忍受不可用、排队过久或API波动。开发者也不会因为一个模型曾经震撼世界,就把核心业务压在不稳定的接口上。 与此同时,Anthropic等公司对蒸馏路径进行封锁之后,DeepSeek下半年如果继续冲击第一梯队,就需要采购更多高质量数据集,训练成本会明显抬升。 更强模型通常需要更多高质量数据、更大规模算力、更复杂的后训练系统、更高强度的评测和安全对齐。基础模型很花钱,也很吃算力。越接近第一梯队,边际成本越高。 江一提到,幻方量化去年收入不错,今年也保持较好水平,但国内围绕量化交易出现了不少监管和合规要求,相关调整本身就需要投入。 生态不是把模型开源出去就自然长出来的,它需要稳定API、开发者工具、公司服务、文档体系、计费体系、安全合规、客户成功和渠道合作。 单纯依赖开源声量和基础API收入,很难支撑一家具备全球影响力的基础模型公司继续向前。商业化不是背叛技术路线,而是技术路线进入长期竞争后必须补上的底座。 它是服务器、数据、算力、人才、期权、商业化生态叠加在一起之后的必然结果。对于像DeepSeek这样,以模型能力立身的公司来说,这些事物反而比估值数字本身更关键。 真正健康的局面,应该是DeepSeek继续做DeepSeek,其他模型也被看见、被比较、被承认。中国AI不应该永远等待一个名字再次震撼世界,而应该让很多公司在不同方向上一起往前走。 一家公司的成熟,常常不是从掌声最响的那一天开始,而是从掌声落下之后,它仍然愿意去修服务器、买数据、招人、谈客户、发账单、处理宕机、重写文档、把产物一点点变稳定开始。




