
当大模子竞赛从“参数武备”转向“应用落地”,一个遮拦而高增长的底层生意正在浮出水面——“Token工场”(把东说念主工智能智力拆解成最基础的计量单元“Token词元”,像自来水厂不异按需供应)。
6月16日,国内AI(东说念主工智能)推理作事企业“硅基流动”官宣完成超20亿元B轮融资,创下2026年以来国内第三方MaaS(模子即作事)赛说念最大单笔融资记载。《逐日经济新闻》记者了解到,这家缔造不及三年的企业,曩昔一年日均Token模糊量达数万亿量级,营收同比涨超十倍,还曾在11个月内连获三轮融资,成为一级市集炙手可热的主义。
无独到偶,5月,同赛说念企业无问芯穹、魔形智能纷繁文书融资。其中,无问芯穹再获超7亿元融资,累计融资额超22亿元。限度4月底,无问芯穹AgenticMaaS大模子作事平台的日均Token调用量相较于客岁底已增长超20倍。
成本狂热加码的另一面,头部互联网大厂全面落地自研推理算力与MaaS作事、全行业API(应用模范编程接口)订价堕入尖锐化竞争、端侧轻量化模子捏续分流云霄Token调用需求。多重挤压之下,“Token工场”浩繁堕入业务鸿沟高速延长、盈利空间不断收窄的矛盾地方,如何走出增收不增利的困局成为赛说念中枢议题。
产业成本扎堆入局“Token工场”成AI落地中枢赛说念
一笔20亿元级融资,将“Token工场”赛说念再次推至聚光灯下。
据硅基流动官方泄露,本轮融资由携程战投、晶科动力控股、金蝶股份、联通新沃、盛奕成本(津润集团产业成本)、壁仞战投、蔚来成本、商汤战投、巨东说念主收罗等二十余家机构长入投资。至此,硅基流动已获取动力、芯片、算力基础措施、云作事、大模子及场景应用等AI全产业链企业投资,产业成本在本轮融资中占比权贵升迁。

这并非赛说念首笔大额融资。本年5月,同赛说念玩家无问芯穹刚完成超7亿元融资;外洋市集中,FireworksAI缔造四年盘算估值达150亿好意思元,日处理Token鸿沟15万亿。短短一年时分,“Token工场”已从AI产业链旯旮模范,跃升为一级市集的中枢赛说念。
成本热捧的底层逻辑,是AI需求结构的根人性切换。
大模子智力每迈上一个台阶,就解锁一大类应用,应用反过来又升迁了底层Token破费量。据国度数据局干统统据,2024岁首中国日均Token调用量为1000亿;至2025年底跃升至100万亿;本年3月已浮松140万亿,两年增长超千倍。
群众知名征询机构IDC最新发布的《中国AI软件市集半年度跟踪,2025H2》数据闪现:2024年中国企业级MaaS市集调用量仅114万亿Token,2025年跃升至1944万亿Token,同比增长约16倍;2025年公有云MaaS市集鸿沟达30.7亿元,增速远超AI行业合座水平。Agent智能体普及、多模态应用落地、行业数字化转型三大趋势,仍在捏续推高Token破费鸿沟。

IDC预测,2026年中国MaaS市集的Token破费量将达到40000万亿,较2025年再增约20倍。
从生意模式现实来看,Token工场并非浅薄的算力转售,中枢是将芯片适配、模子部署、推理引擎调优、异构算力调治等复杂工程智力,封装为圭臬化API接口。客户按需调用、按量付费,省去了企业自建集群、组建运维团队的重插足,大幅镌汰了AI落地的技能门槛与成本周期。
面对海量的市集需求爆发,大鸿沟、高性价比Token的褂讪供应,正成为影响AI技能鸿沟化落地的要津智力。
天神投资东说念主、资深东说念主工智能内行郭涛袭取《逐日经济新闻》记者采访时默示,从“卖模子”到“卖Token”是AI产业生意化的费事演进。Token算作大模子处理信息的最小单元,具备可计量、可订价、可往还的脾性,将AI智能智力改换为可圭臬化往还的巨额商品,搞定了AI智力难以量化的行业痛点,激动行业从定制化作事模式转向圭臬化、鸿沟化变现模式,耐久来看这门生意具备较好的可捏续性。
中金公司研报闪现,“Token工场”模式已成为群众大模子厂商的主流生意化旅途,外洋头部企业Anthropic年度往往性收入浮松300亿好意思元。盈利层面,现时外洋头部大模子API业务毛利率浩繁在40%至50%,国内大模子厂商MaaSAPI业务毛利略低于外洋,预测本年将达到20%至40%,跟着鸿沟效应开释与技能优化,耐久仍有上行空间。
大厂下场、API价钱战尖锐化、端侧AI快速普及⋯⋯“Token工场”盈利承压
不外,头部企业营收十倍增长的亮眼数据背后,赛说念隐忧永恒存在。跟着互联网大厂下场布局、API价钱战尖锐化,“Token工场”的生意模式界限与增长天花板正被从头凝视。
大厂躬行下场是最径直的行业变量。

6月8日,沙巴·体育世界杯(中国)官方网站阿里巴巴文书组织架构疗养,将通义大模子行状部与将来生活实验室整合,缔造全新TokenFoundry行状部,由集团CEO(首席奉行官)吴泳铭径直追究。此前3月,阿里缔造ATH(AlibabaTokenHub)行状群,仍是喊出了“创造Token、运输Token、应用Token”的中枢盘算。
将Token分娩升迁至集团策略级,背后是大厂对推理作事进口价值的重估:Token产能既是撑捏自己电商、云作事、腹地生活等业务AI化的基础,亦然阿里云对外输出MaaS作事的中枢产能。
郭涛以为,大厂全面入场后,零丁第三方“Token工场”仍有生涯空间。他向记者默示,大厂虽有技能、资源和生态上风,但市集需求各样且复杂,难以掩盖通盘领域和场景。零丁第三方可聚焦特定垂直领域提供个性化、定制化作事,或深耕特定技能优化,针对某类模子或场景升迁Token生成恶果与质料。此外,部分企业出于数据安全、幸免过度依赖单一厂商的考量,也会聘任与零丁第三方合营。
API价钱战捏续尖锐化,则是现时“Token工场们”靠近的最径直盈利压力。
自2023年以来,头部大模子厂商已累计十余次下调API价钱,部分主流模子千Token价钱从领先的数毛钱降至几分钱,累计降幅超90%。枯竭中枢优化智力、仅靠算力差价盈利的中间商型玩家已率先堕入损失。
本年5月,DeepSeek官方文书V4-Pro模子API长久降价,合座降幅75%,百万Token输出价钱为6元。随后,小米、腾讯云纷繁跟进,小米旗下MiMo-V2.5系列API长久降价,最高降幅达99%,Pro版订价与DeepSeekV4-Pro全都对王人。腾讯云自6月3日0时起,对DeepSeek-V4系列模子调用价钱进行大幅下调,最高降幅达到97.5%,疗养后价钱全面捏平DeepSeek官方售价。

业内浩繁以为,若“Token工场”恶果升迁的速率跟不上价钱下跌速率,生意模式的可捏续性将径直靠近挑战。
此外,端侧AI的快速普及,则从需求端分流市集。随入部属手机、PC(个东说念主电脑)等终局斥地的端侧大模子智力升级,无数轻量级推理任务向端侧迁徙,无需调用云霄Token。行业浩繁预测,将来30%至50%的推理需求将在端侧完成,尽管高复杂度、多模态、长高下文的中枢推理需求仍依赖云霄,但端侧分流无疑收窄了云霄“Token工场”的合座增长天花板。
与此同期,头部客户自建推理集群的趋势也在蚕食第三方市集份额。金融、动力、政务等数据明锐型行业出于合规考量,更倾向私有化部署;头部互联网企业跟着业务鸿沟扩大,自建算力集群的单元成本已低于第三方采购,纷繁转向自建。第三方“Token工场”的中枢客群,可能渐渐向中小企业、长尾应用与弹性需求场景集会,市集定位靠近重构。
米兰体育2026世界杯指定中国官网关于“Token工场”赛说念的泡沫争议,郭涛向记者默示,现在市集如实存在一定泡沫迹象。无数成本涌入下,部分企业为追求鸿沟盲目延长,淡薄现实成本与盈利情况。但合座而言,AI发展是势在必行,Token经济算作其生意化要津模式有着信得过需求撑捏,仅仅市集需要经验疗养与整合。
谈及破局旅途与行业终局,郭涛以为,“Token工场”可通过升迁算力运用恶果、优化能耗镌汰运营成本,通过分级服求达成互异化订价获取溢价,还可配套模子优化提议、技能支捏等升值作事拓展收入开端。
“耐久来看沙巴体育世界杯中国官网首页,市集更可能酿成多头绪、互异化的竞争形貌:头部大厂凭借实力占据通用型大鸿沟市集,中小‘Token工场’凭借脾性作事深耕细分领域,酿成错位竞争,共同组成多元的市集生态。”郭涛默示。

备案号: