AI的尽头是token(词元)?一文读懂

频道:魅力德宏 日期: 浏览:1

3月30日,AI算力低开高走,$通信ETF华夏(515050)、$创业板人工智能ETF华夏(159381)盘中强势翻红。

Token,正在逐步成为AI领域的核心话语符号。

2026年中国发展高层论坛上,国家数据局局长刘烈宏正式官宣:人工智能领域的核心计量单元Token,其中文标准译名确定为词元。

3月17日,英伟达2026GTC大会上,CEO黄仁勋发表重磅主题演讲,其中「Token」一词累计出现超70次。

过去一两年,关于AI的尽头是什么,市场讨论度居高不下,AI的尽头是算力,算力的尽头是电力成为故事的主旋律。而Token一词的出现,则为这一问题提供了一个更加直接的答案。

Token(词元):AI的成本计量单位

理解Token的意义,先要搞清楚它到底是什么。

在AI的世界里,Token(词元)是模型处理信息的最小计量单位,贯穿模型训练、用户交互、智能体任务执行的全流程,无论是用户的提问,还是AI生成的一段代码,所有AI行为对应的算力消耗、成本核算,最终都要被拆解成Token来完成运算。

举个例子,你问AI“哪些水果的维生素C含量比较高”,这句话会被AI的“分词器”自动切成一个个独立的Token,“哪些”是一个token、“水果”是一个token,“的”是一个token……这几个Token,就是AI要处理的 “输入量”;而AI给你的回答,比如“常见的高维C水果有鲜枣、猕猴桃、草莓、橙子、番石榴等”,也会被拆成一个个Token来计算,这就是“输出量”。

这些Token,成为了AI使用成本的核心标尺。输入多少Token,收多少钱;输出多少Token,再收多少钱。

黄仁勋在GTC演讲中,这样定义:“Inference is the workload and tokens are the new commodity.”(推理是核心工作负载,词元是全新的大宗商品)。

他将Token类比为工业时代的石油、电力,称其为AI时代的核心燃料与基础生产资料,是衡量智能价值的基本单位,未来将渗透到医疗、工业、农业、航天等所有产业场景,成为数字经济运行的核心价值载体。

Token经济学:AI如何定价

Token,与字符有着本质的区别。

字符,是“文本的物理单位”,你打出来的每一个字、标点、字母,对应的字符是统一且固定的。比如“苹果” 2个字符,“你好”2个字符。

而Token,是“AI 的语义+价值单位”。什么意思呢?

一方面,Token的拆分遵循“AI能听懂的最小有意义的话块”,按“完整意思”打包,不按字数拆,同样一句话,在不同的AI里,可能对应的Token数量就不一样。

另一方面,Token是强价值锚定的,具有一套定价体系。就像石油有“原油、汽油、航空燃油”,快递有“平邮、特快、加急、专人闪送”不同品级定价一样,Token也按“响应速度、语义复杂度、回答质量”分层。黄仁勋在2026 年GTC演讲里,专门讲了Token的五层分层定价:免费层→基础层→进阶层→高速层→超高速顶级层。

更便宜的免费层,高、响应慢,靠广告变现,覆盖日常免费查问的基础需求;往上是基础商用层,每百万Token3美元,适配改短句、写请假条这类简单日常需求;再往上是进阶层,每百万Token6美元,对应写方案、算数据这类中等难度需求;再往上是高速层,每百万Token45美元,主打低延迟高响应,适配企业实时 *** 、内部查资料这类刚需,优先占用优质算力;最贵的超高速顶级层,每百万Token150美元,和基础层价差整整50倍。

从3美元到150 美元,这50倍的差别在哪?就在响应速度、输出质量、上下文处理复杂度上。这就像寄快递,同一个包裹,普通快递便宜但慢,专人闪送贵但快、品质有保障,核心就是服务优先级、速度和质量的差别。

Token梯度定价模式,当前多个大模型已开始实践。例如2026 年初,谷歌发布的Gemini 3.1 Pro定价:输入token:每百万 2.00 美元(输入量 <= 200K),每百万 4.00 美元(输入量 > 200K)。输出token:每百万 12.00 美元(输入 <= 200K),每百万 18.00 美元(> 200K)。国内阿里云则更是对Qwen模型根据上下文长度分了0-32k,32-128k和128k以上三档定价。

Token(词元)激增:消耗逻辑是什么

如前述所言,Token贯穿AI全生命周期,不管是AI模型的训练,还是使用AI时指令的输入、问题的输出,本质上都在消耗Token。这也意味着,哪怕模型训练侧的算力迭代速度出现减缓,只要AI使用需求存在,那么Token就会一直被消耗。

这也打破了人们关于AI算力天花板的担忧,AI需求已从阶段性的训练算力,转向持续性、刚性的推理算力。

不仅如此,需求端的变化清晰可见,随着AI应用从被动应答的Chat对话模式,向可自主完成感知、规划、执行的Agent智能体演进,以及企业级AI部署的全面提速,推理算力需求将呈指数级爆发,带动词元调用量持续攀升。OpenRouter的监测数据显示,头部大模型的词元周调用量保持稳定增长。而传统CPU云计算已难以适配智能体高并发、长链路的执行需求,这进一步抬升了高性能AI算力的刚性需求。

具体来看,传统单次对话的词元消耗线性可控,用户问一句,模型答一句,任务闭环即结束;而智能体要完成一项复杂工作,需要多轮推理、多工具调用、多步骤执行,推理链路更长、任务复杂度更高,直接带动词元消耗进入持续增长通道。IDC预测:2031年中国企业活跃智能体数量将突破3.5亿,年复合增长率超135%;伴随任务执行密度与复杂度的提升,智能体相关的词元消耗,将保持年均超30倍的增长幅度。

2024年初,中国日均Token(词元)调用量为1000亿;至2025年底,这一数额跃升至100万亿;今年3月,已突破140万亿,两年增长超千倍。(数据来源:国家数据局)

算力服务的涨价,是Token需求量激增的有力证明。

2026年3月,国内主流云厂商相继发布调价公告。阿里云3月18日宣布,自4月18日起对AI算力及智算存储产品进行价格调整——平头哥真武810E等高性能算力卡相关服务价格上涨5%至34%,面向智算场景的并行文件存储产品CPFS(智算版)全地域统一上调30%。公告中明确写道:全球AI需求爆发、供应链涨价,核心硬件采购成本显著上涨。百度智能云紧随其后,AI算力与存储产品的涨幅区间约为5%至30%,与阿里云基本持平。腾讯云的动作更早,3月11日便宣布智能体开发平台结束公测,混元系列模型从免费转向按量计费,计费标准较公测期涨幅超过400%。

需求爆发,供给端的约束同样现实。上游英伟达H200、H100等高端GPU产能持续紧张,交付周期已延长至2027年,硬件采购成本持续上行。国内智算中心的建设与扩容存在较长周期,算力供给的增速难以匹配词元消耗的增长节奏,供需关系因此持续偏紧。

谁在生产token(词元)?

在今年的GTC大会上,黄仁勋声称,“数据中心正从计算中心转向Token生产工厂”,“核心竞争力不再是单纯的算力规模,而是每瓦特电力能够生成的Token数量”。

什么意思呢?过去传统数据中心的核心目标是“提供算力资源”,前几年算力高速扩张的时候,英伟达数据中心的营收、订单往往被视为算力景气度的风向标,订单越多,意味着云厂商的算力资本开支堆得越多。而在Token时代,算力提供者正演变为“token工厂”,生产方式也在发生显著变化,AI产业的竞争重心,正从“模型参数大小的军备竞赛”,转向Token生产效率、调度能力与商业化落地能力的较量,核心竞争力不再是堆多少台机器,而是每度电能炼出多少Token。

这种转变正在重塑产业链的每一个环节。

上游:Token的"生产车间"——智算中心基建

与传统数据中心不同,AI智算中心是高密度、高功耗的"重工业":单机柜功率从5-8kW飙升到30-100kW,传统风冷无力应对,液冷成为刚需;GPU集群对电力稳定性极度敏感,毫秒级的电压波动都可能导致训练任务崩溃。

这意味着,机房资源、液冷散热、稳定供电这些过去被视为"配套设施"的环节,如今成了Token生产的瓶颈。谁能提供高密部署能力,谁就能在Token产能竞赛中占据先机。

中游:Token的"生产工具"——算力芯片、光通信、算力租赁

算力芯片是生产Token的核心工具,但英伟达高端GPU的产能约束,让算力租赁成为短期最直接的受益环节——就像淘金热中卖铲子的人,无论哪家AI公司成功,都需要租用算力来生产Token。与此同时,国产AI芯片正在构建自主可控的Token生产线,从"能用"向"好用"迈进。尽管与英伟达最新一代旗舰产品仍有代际差距,但当前国内头部厂商的主流产品,FP16/BF16算力普遍落在100-300 TFLOPS区间,基本对齐英伟达A100水平。少数领先企业通过先进封装、Chiplet等技术创新,已实现接近H100的算力表现。并在本地化服务、政策适配、成本控制等维度建立起差异化优势。随着产业资本持续注入,国产算力平台将持续受益于Token生产的"国产化替代"进程。

光模块和光通信 *** 是连接这些算力的"物流干线"。现代智算中心内部,成千上万张GPU卡需要以微秒级延迟、TB级带宽进行数据交换——电信号传输在距离和速率上已触及物理极限,光通信成为唯一解。光模块是这套系统的核心器件,承担着电信号与光信号的高速转换。随着单集群规模从千卡向万卡、十万卡演进,光模块的需求呈指数级增长:不仅数量激增,更向800G、1.6T乃至3.2T速率迭代。头部光模块厂商凭借封装工艺与供应链优势,直接受益于Token产能扩张带来的带宽刚需。

光通信 *** 架构也在因Token生产而重构。传统数据中心采用"树形"拓扑,带宽逐层收敛;而AI训练要求任意GPU间实现全带宽、无阻塞通信,"胖树"(Fat-Tree)乃至全光交换架构成为主流。这意味着光纤用量大幅增加,光交换机、光分路器等新型设备进入数据中心,推动光通信产业链从"配角"走向"核心基础设施"。

下游:Token的"流通与变现"——云厂商与应用端

云厂商是Token经济的"电网"和"交易所"。它们连接算力供给与市场需求,通过优化Token生产效率、设计灵活的计费体系(按Token调用量收费而非按服务器租赁),将算力转化为可规模化的AI服务。

而Token的最终价值,要在应用场景中兑现,Token的变现效率正在成为衡量AI商业化的核心指标。2026年,阿里巴巴成立Alibaba Token Hub(ATH)事业群,由CEO吴泳铭直接管理,整合通义千问、钉钉、夸克等集团全部核心AI资源,将“创造Token、输送Token、应用Token”定为集团AI业务的核心目标。吴泳铭在内部明确:“未来大量数字化工作将由AI Agent完成,而Agent运行的本质,就是Token的消耗与流转。”

围绕“Token生产—Token流通调度—Token消费变现”,Token正串联起算力基建、算力供给、商业应用的全产业链机遇。

ETF高效布局

通信 ETF 华夏(515050):跟踪中证5G通信主题指数,ETF规模位居同指数之一。持仓覆盖光芯片、光模块、光器件、光纤光缆、PCB、存储、液冷、算力租赁等算力核心硬件龙头,成分股多为全球AI算力供应链的核心厂商,业绩兑现确定性强。热门概念分布方面,数据中心:69%,CPO:67%,液冷服务器:42%。场外联接(A类:008086;C类:008087) 

通信ETF华夏

股票型

科技

12.27%

近6月涨幅

基金经理:李俊

查看详情

创业板人工智能ETF华夏(159381):跟踪创业板人工智能指数,持仓覆盖 CPO、算力租赁、AI大模型、AI Agent等AI全产业链,兼顾算力硬件与软件应用,费率为同类更低。热门概念分布方面,数据中心:68%,AI智能体:39%。场外联接(A类:025505;C类:025506) 

创业板人工智能ETF华夏

股票型

科技

21.79%

近6月涨幅

基金经理:单宽之

查看详情

电网设备ETF华夏(159326):是全市场唯一跟踪中证电网设备主题指数的产品,申万二级行业中电网设备含量超77%,为全市场最纯的电网指数;其中智能电网权重占比高达90%,特高压权重占比高达69%,均居全市场首位。从申万三级行业分类上看,指数成分股的行业分布以输变电设备、电网自动化设备、线缆部件及其他、通信线缆及配套、配电设备为主,拥有较强的代表性。

风险提示:

以上基金风险等级为R4(中高风险),具体风险评级结果以基金管理人和销售机构提供的评级结果为准。本资料仅为服务信息,不构成任何投资建议或承诺,也不作为任何法律文件。投资者在投资前,请务必仔细阅读基金的《基金合同》、《招募说明书》和《产品资料概要》等法律文件,充分认识本基金的风险收益特征和产品特性,并根据自身的风险承受能力理性决策。我国基金运作时间较短,不能反映股市发展的所有阶段。市场有风险,入市需谨慎。

费用重要提示:以上所提及ETF均不收取申购费、赎回费、销售服务费。申购赎回 *** 机构可按照不超过0.5%的标准收取佣金,其中已包含证券交易所、登记结算机构等收取的相关费用。此外,相关ETF的管理费率和托管费率均从基金资产中扣除,具体费率如下表所示。