2026年1月8日,中国AI大模型初创公司智谱,正式在港交所挂牌上市,成为“全球大模型第一股”。一天后,另一家模型公司MiniMax,也将紧随其后敲钟。 2023年,这些AGI(通用人工智能)的理想主义者,快速被推至台前。伴随着高估值、高起点而来的,难免是最为严苛的审视和比较。比如2025年初,DeepSeek的异军突起,促使六小虎中的几家不得不迅速调整业务、裁撤团队,才度过了至暗时刻。 在厚雪长坡的大模型领域,任何暂时的落后、误判,都会成为“德不配位”的佐证。即便在顺利IPO的当下,比起祝福,账上的亏损才更是人们的谈资。 但我们往往忽略了,恰恰是这一群资金不算雄厚、试错成本却不低的大模型创业公司,标记了中国大模型进程的几个重要节点。 后来,全球首个能操作手机的通用Agent,是智谱发布的AutoGLM,比后来的豆包手机早了整整14个月;现如今,全球首家IPO的大模型初创公司,也是来自中国的智谱。 比起抠招股书上的亏损,如今对前沿创新型行业、对创业者们而言,更有价值的命题在于,分析这几家中国大模型创业公司如何在竞争残酷的大模型赛道呈现出强大的生命力,并如何一直在AI马拉松上领跑。 创新的训练和推理架构,让DeepSeek一跃成为国际上知名度最高的中国大模型,为了同开源的DeepSeek争取市场声量,六小虎也不得不忍痛割去闭源的部分利润,快速跟进。 “基座模型的性能,就是模型厂商的竞争力。”DeepSeek的掀桌,让模型行业迅速拉齐了这一共识。其中,颇具火药味的一幕发生在2025年7月。为了争夺全球开源模型的SOTA的位置,各个玩家都使出了浑身解数。 今天,智谱创立发起人兼首席科学家唐杰发布内部信,宣布将很快推出GLM-5。信中表示,在智谱旗舰模型GLM-4.7发布后,其MaaS ARR年化收入从2000万增至超5亿,10个月获25倍增幅,与Anthropic指数级增长同频。 即便一举动摇了B端市场,但DeepSeek的爆火,也变相完成了对公司客户的市场教育。线性资本董事总经理郑灿曾在媒体采访中直言:“DeepSeek的作用,尤其体现在市场教育方面,格外节省了成本。” 与此同时,公司客户也意识到,强调模型能力的同时,B端服务是一套强调模型厂商行业认知、服务能力的体系。这意味着,理解公司的业务,为公司提供基于专业数据的定制化训练和部署服务是有门槛的。 相对地,做大了的B端蛋糕,被那些具有成熟服务能力的模型厂商承接了下来。最具代表性的案例,是以大模型API调用为主要商业模式的智谱。全球大模型平台OpenReutor的数据显示,GLM-4.5和GLM-4.6自上线以来,调用量稳居全球前10,同时付费流量收入超过所有国产模型之和。 智谱高级副总裁吴玮杰在小红书表示:在智谱的客户群中,G端客户不到20%,互联网占比50%;同时,公司本地化的毛利率一直保持在60%以上,是传统公司均值的2倍,账期也远低于行业平均水平。 在招股书中,我们或许只能看到,2025年上半年,来自本地化部署的收入占比高达84.8%。但招股书无法显示的一面是,随着GLM-4.5等一系列高性能模型的发布,API调用和订阅,已经逐渐代替本地化部署,成为智谱收入的第一增长曲线。 据36氪了解,仅智谱MaaS开放平台(bigmodel.cn)中面向开发者的订阅产物GLM Coding,ARR在上线2个月内,就快速突破了1亿元。2025年全年,智谱MaaS同比增速超900%,幂次增长态势显著优于海外龙头同期表现。 这也导致,OpenAI任何一次的模型更新和发布,都会引发中国AI创业者的“被吞噬恐慌”。OpenAI创始人兼CEO Sam Altman曾直言:任何试图在我们爆炸半径内建立的初创公司或产物,都会被碾压。 今年开始,一个在模型领域悄然发生的转变是,成为“中国的OpenAI”或者“中国的Anthropic”,不再作为一种定位或目标,被中国厂商们频频提起。 中国模型被世界看到,已经是确定性的事实。其中的主力军,不全然是资源优渥的大厂,而是几家“续航能力”一度不被看好的六小虎。 海外的商业化表现,是中国模型被海外市场认可和接纳的侧面印证。在两家“六小虎”最近披露的招股书中可以看到,2025年截至9月30日,MiniMax的境外收入,占到了总收入的73.1%。 受到美国出口管制的智谱,看似在海外最大的北美市场失去了入场机会。但出人意料的是,36氪获悉,智谱面向开发者的模型业务获得自全球184个国家的15万开发者每月付费。 先来看一个美国开发者案例。2025年9月,一名来自美国的数据科学家Manpreet Singh发帖,控诉Anthropic旗下的Claude Code能力存在缺陷——早些时候,Anthropic官方也承认,由于推理堆栈的更新问题,Claude Opus 4.1和Opus 4的质量的确有所下降。 最后,这名数据科学家转向使用智谱旗下的模型GLM-4.5。他在博客中提到,GLM-4.5的Coding性能接近Claude Sonnet 4,但API价格仅为后者的1/7,包含Coding功能的GLM Coding Plan,月费最低仅20元人民币,价格是Claude Code的1/6。 月之暗面的Kimi-K2、MiniMax的模型,近期也上架了亚马逊云科技的模型服务平台Bedrock。此前,硅谷基金Social Capita的创始人Chamath Palihapitiya,就公然带头“倒戈”中国模型。将大量工作负载转向Kimi K2后,他评价:“K2的性能确实足够强,而且说实话,比OpenAI和Anthropic便宜太多了。” 其中一个典型案例是,2025年初,智谱拿下了某“一带一路”国家的海外订单,价值千万美元。近期马来西亚宣布其国家级MaaS平台,基于智谱Z.ai的开源基础模型构建。知情人士曾告诉36氪,这些订单的性质,是“国家级主权大模型”的共建——出于国家数据安全的考量,第三方独立模型厂商,将承担愈发重要的角色。 “在美国或欧洲竞争对手之前,(智谱)将中国的系统和标准锁定在新兴市场。”这股独立力量的崛起,也引起了OpenAI的重视。2025年6月,OpenAI分析师发现,智谱在多个地区获得了政府的订单。他们评价:“智谱展示了一种负责任的、透明的、随时可审计的中国AI替代方案。” 彼时技术的黑箱、高昂的成本,都让大模型创业成为一场“绝命赌局”。美团联合创始人王慧文最早躬身入局大模型赛道时,曾对36氪“智能涌现”直言:“现在(AI领域)我觉得大家要同舟共济,别互相拆台。”“勇于踏上这条路的人我都鼓掌,上路的都是勇士。” 两年的时间,沧海桑田。六小虎之中,已经有两家公司搁置了基座大模型的预训练,或聚焦业务,往医疗这一垂类领域发力,或开始转型,做各类行业解决方案。“活下去”,对大多数大模型创业公司而言,成为比“探索智力上限”更重要的命题。 招股书显示,智谱和MiniMax,两家公司在过去三年里烧了近110亿元。其中,将近70%的支出用于模型研发。尤其是智谱,2024年研发投入高达21.95亿元,占当年总支出的约80%。 曾有人将大模型之战,比喻为“看不到终点,也停不下来的征途”。毕竟,每个先进模型的领先窗口,往往只有几个月;而对于资源并不充沛的初创公司而言,每一次模型训练,都是燃烧在数万、数十万张算力卡上的赌局。 科技行业的残酷性在于,只有成功的一瞬会被铭记。但在这一瞬背后,创新者的投入是难以计量的。比如,在ChatGPT引爆科技圈的那个冬天之前,OpenAI已经蛰伏了近7年——前期GPT-1、GPT-2等“无名成果”的经验累积,才造就了GPT-3.5。 再比如2025年初一鸣惊人的DeepSeek,如果没有此前团队在MLA、新MoE架构、self-play等技术上的一系列创新,就不会有V3和R1的突破——其中的投入,是梁文锋在访谈中隐隐透露的“与头部大厂匹配的人才薪资”“不设上限的算力额度”。 这也意味着,AI领域的长期主义,是持续创新和投入的定力。在玩家纷纷转型或退场的当下,留在牌桌上的大模型公司,都是勇士。 平心而论,MiniMax和智谱披露的亏损,是AI发展仍处于早期的证明,也是创新所需代价的客观凭证。如果将110亿元,与未来大模型能撬动的千亿、万亿增强相比,显然是ROI极高的一笔投入。 但市场仍然需要独立的第三方开发厂商。事实证明,如今AI领域重要的创新和发布,大多来自几家初创公司。无论是海外的OpenAI、Anthropic,还是DeepSeek和留在牌桌上的几家六小虎们——初创公司更为灵活的组织形态、不被业务惯性拖累的运行模式、更加中立,是大厂无可比拟的优势。 当下,中国第一梯队的模型公司,即便技术能力已经达到与国际一流厂商掰手腕的水平,但估值和市场认知度,依然与之相差甚远。比如,法国AI模型公司Mistral AI的最新估值为140亿美元;IPO前,MiniMax的估值约42亿美元,智谱估值为243.8亿元(约35亿美元)。两者的估值之间,几乎有3-4倍的差距。 上市的好处是显而易见的:智谱和MiniMax将有望获得更公允的价值评判,以及更广泛的国际影响力。IPO后,智谱的市值预计超过500亿港元,是此前估值的约2倍。与此同时,在厂商竞争力某种程度上也是人才竞争力的当下,IPO让初创公司,在国际上有了更响亮的人才号召力。




