虎嗅独家获悉,3月16日阿里内部围绕“Token”链路,重新梳理整合了业务架构,并成立了新事业群:Alibaba Token Hub(ATH)事业群,阿里巴巴CEO吴泳铭将直接负责这个事业群。这也是自阿里内部电商事业群整合以来,最重要的一次架构调整。 虎嗅获悉,ATH事业群成立后的核心目标,将以Token的创造、输送、应用为核心目标。ATH的成立,也是旨在提高各个部门之间的战略协同,并强化各个部门通过AI提高生产力。 ·通义实验室:(Qwen大模型的整体研发工作)创造领先的多模态模型,不断追求基础模型能力上限,为集团和业界提供最领先模型。 值得注意的是,此前阿里整体AI科技布局以“通云哥”体系为主,即阿里云(算力)和平头哥(芯片)扮演着通义实验室(大模型)的基础。而ATH这一架构实际上把原本“通云哥”的“通”进一步放大,涵盖了整个AI在B/C的布局。 简单来说,每一个模型产物都会把用户输入和获取的文本拆分为“最小语义处理单元”,这是AI大模型理解和生成的“基础元件”,而这个基础元件就是Token。在中文AI产物中,普遍而言1个汉字约等于1Token,而AI产物一般按照“Token量”来计算消耗与成本。 Token热的背后,本质上AI需求向生产力端的快速转移。春节期间,阿里云CodingPlan的Tokens成为了阿里云史上销量增长最快产物,甚至“首购优惠”因为过于火爆在上线两周后逐渐停止了。Token重要性,引发了阿里对于AI整体布局的思考。 ·AI Coding能力在过去两三个月已跨越临界点,大部分应用系统都能通过模型来解决,云计算产物的用户将从人类工程师逐渐变成AI Agent,未来的云不只是”人用",更多是"AI用"。 总结来说,吴泳铭认为,AI引发生产方式的根本性变化,由于大量“AI员工”将成为主力,“AI员工”所必须的粮食“Token”将进入一个需求大爆炸时期,这是一个关键机会。 新成立的ATH,涵盖了通义实验室、百炼MaaS、千问、悟空以及创新应用五个事业部。它的基础架构脉络是,把Token拆分为创造、输送、应用三个关键阶段: ·输送Token:对应阿里内部的百炼 MaaS,这是一个公司级的大模型服务平台,涵盖了Qwen大模型及其衍生模型,除了模型产物外,还有大量做AI应用的工具。这个平台的主要作用之一,是帮助公司快速做AI应用。相当于把Qwen生产的Token以多种“产物”形态,输送到了公司级用户手中。 ·应用Token:对应阿里内部的千问(C端AI产物)、悟空(钉钉旗下的公司级通用AI Agent)、创新应用(各种针对细分场景的AI应用),这些产物相当于在一个横纵坐标系里开发的各种应用,横纵坐标系包含了细分的用户和细分的场景。 这一组织变化的核心因素,是高层希望通过调整,强化协同,针对Token整体链路实现“大兵团作战”。在ATH这个新架构下,原有的“BU墙”被彻底打破,几大部门将由ATH统一调度、协同。比如Qwen与千问APP之间的协同将一改之前的跨事业群合作模式,而成为同一事业群下的共同奋战。 值得注意的是,ATH的本质逻辑,是通过Token这个“抓手”把原本分散的AI业务板块,串联为一体,并形成可以上下游有机联动的“工业生产式体系”。在最上游,Qwen的基座模型能力是贯穿ATH所有业务板块的基础生产要素;在下游,通过B/C不同用户和场景细分,Qwen的基座模型能力进行各种形态的释放,在这个“诞生——释放”过程中,Token被产生和消耗,形成了一个完整的生态。 虎嗅获悉,前Qwen技术团队负责人林俊旸此前曾表达了对“整合思路”有不同看法。有接近林俊旸的人透露,林更希望Qwen独立运转。这和高层希望Qwen加大与相关部门协同的思路差异明显。 在高层的认知中,当下围绕AI的竞争,已经是大厂和AI独立巨头们围绕AI生产力的“工业体系”、“工业生态”之间的竞争了。如果Qwen依然只关注开源社区关注度和下载量,那么可能在“生产力”维度的竞争中落入下风。 在合并之前,Google Brain主要负责谷歌AI产物(产物化、工程落地),而DeepMind主要负责前沿研究、通用智能。两个团队在技术路线上存在差异,这造成了资源内耗。在OpenAI崛起后,谷歌进行复盘,认为这种内部的“割裂”是造成落后的因素之一。 在合并两个部门过程中,谷歌也是采用了组织架构统一的方式,并统一梳理了内部的技术路线和资源分配,这成为谷歌后续Gemini模型成功的诱因之一。 阿里整合资源成立ATH,实际上有谷歌当年合并两大部门的影子。但相比之下,谷歌的合并更多是基于“AI研发、产物统一”这个维度,而阿里的思路则是基于Token的“生命周期链路”。从这个视角看,阿里其实更倾向于AI的“可使用”。 摆在面前的挑战也是存在的。AI研发和AI产物间的协同,素来不是简单的架构整合就能解决的,它更需要巧妙的共同目标设计以及内部激励制度的升级完善。 当下正处于AGI爆发前夜。大量数字化工作将由数以百亿计的AIAgent来支撑,而这些AI Agent将由模型产生的Token支撑运行,成为人类与数字世界交互的主要载体。




