AI的尽头是token（词元）？一文读懂

频道：魅力德宏日期：2026-03-30 14:57:08 浏览：39

3月30日，AI算力低开高走，$通信ETF华夏(515050)、$创业板人工智能ETF华夏(159381)盘中强势翻红。

Token，正在逐步成为AI领域的核心话语符号。

2026年中国发展高层论坛上，国家数据局局长刘烈宏正式官宣：人工智能领域的核心计量单元Token，其中文标准译名确定为词元。

3月17日，英伟达2026GTC大会上，CEO黄仁勋发表重磅主题演讲，其中「Token」一词累计出现超70次。

过去一两年，关于AI的尽头是什么，市场讨论度居高不下，AI的尽头是算力，算力的尽头是电力成为故事的主旋律。而Token一词的出现，则为这一问题提供了一个更加直接的答案。

Token（词元）：AI的成本计量单位

理解Token的意义，先要搞清楚它到底是什么。

在AI的世界里，Token（词元）是模型处理信息的最小计量单位，贯穿模型训练、用户交互、智能体任务执行的全流程，无论是用户的提问，还是AI生成的一段代码，所有AI行为对应的算力消耗、成本核算，最终都要被拆解成Token来完成运算。

举个例子，你问AI“哪些水果的维生素C含量比较高”，这句话会被AI的“分词器”自动切成一个个独立的Token，“哪些”是一个token、“水果”是一个token，“的”是一个token……这几个Token，就是AI要处理的 “输入量”；而AI给你的回答，比如“常见的高维C水果有鲜枣、猕猴桃、草莓、橙子、番石榴等”，也会被拆成一个个Token来计算，这就是“输出量”。

这些Token，成为了AI使用成本的核心标尺。输入多少Token，收多少钱；输出多少Token，再收多少钱。

黄仁勋在GTC演讲中，这样定义：“Inference is the workload and tokens are the new commodity.”（推理是核心工作负载，词元是全新的大宗商品）。

他将Token类比为工业时代的石油、电力，称其为AI时代的核心燃料与基础生产资料，是衡量智能价值的基本单位，未来将渗透到医疗、工业、农业、航天等所有产业场景，成为数字经济运行的核心价值载体。

Token经济学：AI如何定价

Token，与字符有着本质的区别。

字符，是“文本的物理单位”，你打出来的每一个字、标点、字母，对应的字符是统一且固定的。比如“苹果” 2个字符，“你好”2个字符。

而Token，是“AI 的语义+价值单位”。什么意思呢？

一方面，Token的拆分遵循“AI能听懂的最小有意义的话块”，按“完整意思”打包，不按字数拆，同样一句话，在不同的AI里，可能对应的Token数量就不一样。

另一方面，Token是强价值锚定的，具有一套定价体系。就像石油有“原油、汽油、航空燃油”，快递有“平邮、特快、加急、专人闪送”不同品级定价一样，Token也按“响应速度、语义复杂度、回答质量”分层。黄仁勋在2026 年GTC演讲里，专门讲了Token的五层分层定价：免费层→基础层→进阶层→高速层→超高速顶级层。

更便宜的免费层，高、响应慢，靠广告变现，覆盖日常免费查问的基础需求；往上是基础商用层，每百万Token3美元，适配改短句、写请假条这类简单日常需求；再往上是进阶层，每百万Token6美元，对应写方案、算数据这类中等难度需求；再往上是高速层，每百万Token45美元，主打低延迟高响应，适配企业实时 *** 、内部查资料这类刚需，优先占用优质算力；最贵的超高速顶级层，每百万Token150美元，和基础层价差整整50倍。

从3美元到150 美元，这50倍的差别在哪？就在响应速度、输出质量、上下文处理复杂度上。这就像寄快递，同一个包裹，普通快递便宜但慢，专人闪送贵但快、品质有保障，核心就是服务优先级、速度和质量的差别。

Token梯度定价模式，当前多个大模型已开始实践。例如2026 年初，谷歌发布的Gemini 3.1 Pro定价：输入token：每百万 2.00 美元（输入量 <= 200K），每百万 4.00 美元（输入量 > 200K）。输出token：每百万 12.00 美元（输入 <= 200K），每百万 18.00 美元（> 200K）。国内阿里云则更是对Qwen模型根据上下文长度分了0-32k，32-128k和128k以上三档定价。

Token（词元）激增：消耗逻辑是什么

如前述所言，Token贯穿AI全生命周期，不管是AI模型的训练，还是使用AI时指令的输入、问题的输出，本质上都在消耗Token。这也意味着，哪怕模型训练侧的算力迭代速度出现减缓，只要AI使用需求存在，那么Token就会一直被消耗。

这也打破了人们关于AI算力天花板的担忧，AI需求已从阶段性的训练算力，转向持续性、刚性的推理算力。

不仅如此，需求端的变化清晰可见，随着AI应用从被动应答的Chat对话模式，向可自主完成感知、规划、执行的Agent智能体演进，以及企业级AI部署的全面提速，推理算力需求将呈指数级爆发，带动词元调用量持续攀升。OpenRouter的监测数据显示，头部大模型的词元周调用量保持稳定增长。而传统CPU云计算已难以适配智能体高并发、长链路的执行需求，这进一步抬升了高性能AI算力的刚性需求。

具体来看，传统单次对话的词元消耗线性可控，用户问一句，模型答一句，任务闭环即结束；而智能体要完成一项复杂工作，需要多轮推理、多工具调用、多步骤执行，推理链路更长、任务复杂度更高，直接带动词元消耗进入持续增长通道。IDC预测：2031年中国企业活跃智能体数量将突破3.5亿，年复合增长率超135%；伴随任务执行密度与复杂度的提升，智能体相关的词元消耗，将保持年均超30倍的增长幅度。

2024年初，中国日均Token（词元）调用量为1000亿；至2025年底，这一数额跃升至100万亿；今年3月，已突破140万亿，两年增长超千倍。（数据来源：国家数据局）

算力服务的涨价，是Token需求量激增的有力证明。

2026年3月，国内主流云厂商相继发布调价公告。阿里云3月18日宣布，自4月18日起对AI算力及智算存储产品进行价格调整——平头哥真武810E等高性能算力卡相关服务价格上涨5%至34%，面向智算场景的并行文件存储产品CPFS（智算版）全地域统一上调30%。公告中明确写道：全球AI需求爆发、供应链涨价，核心硬件采购成本显著上涨。百度智能云紧随其后，AI算力与存储产品的涨幅区间约为5%至30%，与阿里云基本持平。腾讯云的动作更早，3月11日便宣布智能体开发平台结束公测，混元系列模型从免费转向按量计费，计费标准较公测期涨幅超过400%。

需求爆发，供给端的约束同样现实。上游英伟达H200、H100等高端GPU产能持续紧张，交付周期已延长至2027年，硬件采购成本持续上行。国内智算中心的建设与扩容存在较长周期，算力供给的增速难以匹配词元消耗的增长节奏，供需关系因此持续偏紧。

谁在生产token（词元）？

在今年的GTC大会上，黄仁勋声称，“数据中心正从计算中心转向Token生产工厂”，“核心竞争力不再是单纯的算力规模，而是每瓦特电力能够生成的Token数量”。

什么意思呢？过去传统数据中心的核心目标是“提供算力资源”，前几年算力高速扩张的时候，英伟达数据中心的营收、订单往往被视为算力景气度的风向标，订单越多，意味着云厂商的算力资本开支堆得越多。而在Token时代，算力提供者正演变为“token工厂”，生产方式也在发生显著变化，AI产业的竞争重心，正从“模型参数大小的军备竞赛”，转向Token生产效率、调度能力与商业化落地能力的较量，核心竞争力不再是堆多少台机器，而是每度电能炼出多少Token。

这种转变正在重塑产业链的每一个环节。

上游：Token的"生产车间"——智算中心基建

与传统数据中心不同，AI智算中心是高密度、高功耗的"重工业"：单机柜功率从5-8kW飙升到30-100kW，传统风冷无力应对，液冷成为刚需；GPU集群对电力稳定性极度敏感，毫秒级的电压波动都可能导致训练任务崩溃。

这意味着，机房资源、液冷散热、稳定供电这些过去被视为"配套设施"的环节，如今成了Token生产的瓶颈。谁能提供高密部署能力，谁就能在Token产能竞赛中占据先机。

中游：Token的"生产工具"——算力芯片、光通信、算力租赁

算力芯片是生产Token的核心工具，但英伟达高端GPU的产能约束，让算力租赁成为短期最直接的受益环节——就像淘金热中卖铲子的人，无论哪家AI公司成功，都需要租用算力来生产Token。与此同时，国产AI芯片正在构建自主可控的Token生产线，从"能用"向"好用"迈进。尽管与英伟达最新一代旗舰产品仍有代际差距，但当前国内头部厂商的主流产品，FP16/BF16算力普遍落在100-300 TFLOPS区间，基本对齐英伟达A100水平。少数领先企业通过先进封装、Chiplet等技术创新，已实现接近H100的算力表现。并在本地化服务、政策适配、成本控制等维度建立起差异化优势。随着产业资本持续注入，国产算力平台将持续受益于Token生产的"国产化替代"进程。

光模块和光通信 *** 是连接这些算力的"物流干线"。现代智算中心内部，成千上万张GPU卡需要以微秒级延迟、TB级带宽进行数据交换——电信号传输在距离和速率上已触及物理极限，光通信成为唯一解。光模块是这套系统的核心器件，承担着电信号与光信号的高速转换。随着单集群规模从千卡向万卡、十万卡演进，光模块的需求呈指数级增长：不仅数量激增，更向800G、1.6T乃至3.2T速率迭代。头部光模块厂商凭借封装工艺与供应链优势，直接受益于Token产能扩张带来的带宽刚需。

光通信 *** 架构也在因Token生产而重构。传统数据中心采用"树形"拓扑，带宽逐层收敛；而AI训练要求任意GPU间实现全带宽、无阻塞通信，"胖树"（Fat-Tree）乃至全光交换架构成为主流。这意味着光纤用量大幅增加，光交换机、光分路器等新型设备进入数据中心，推动光通信产业链从"配角"走向"核心基础设施"。

下游：Token的"流通与变现"——云厂商与应用端

云厂商是Token经济的"电网"和"交易所"。它们连接算力供给与市场需求，通过优化Token生产效率、设计灵活的计费体系（按Token调用量收费而非按服务器租赁），将算力转化为可规模化的AI服务。

而Token的最终价值，要在应用场景中兑现，Token的变现效率正在成为衡量AI商业化的核心指标。2026年，阿里巴巴成立Alibaba Token Hub（ATH）事业群，由CEO吴泳铭直接管理，整合通义千问、钉钉、夸克等集团全部核心AI资源，将“创造Token、输送Token、应用Token”定为集团AI业务的核心目标。吴泳铭在内部明确：“未来大量数字化工作将由AI Agent完成，而Agent运行的本质，就是Token的消耗与流转。”

围绕“Token生产—Token流通调度—Token消费变现”，Token正串联起算力基建、算力供给、商业应用的全产业链机遇。

ETF高效布局

通信 ETF 华夏（515050）：跟踪中证5G通信主题指数，ETF规模位居同指数之一。持仓覆盖光芯片、光模块、光器件、光纤光缆、PCB、存储、液冷、算力租赁等算力核心硬件龙头，成分股多为全球AI算力供应链的核心厂商，业绩兑现确定性强。热门概念分布方面，数据中心：69%，CPO：67%，液冷服务器：42%。场外联接(A类：008086；C类：008087)

通信ETF华夏

股票型

科技

12.27%

近6月涨幅

基金经理：李俊

查看详情

创业板人工智能ETF华夏（159381）：跟踪创业板人工智能指数，持仓覆盖 CPO、算力租赁、AI大模型、AI Agent等AI全产业链，兼顾算力硬件与软件应用，费率为同类更低。热门概念分布方面，数据中心：68%，AI智能体：39%。场外联接（A类：025505；C类：025506）

创业板人工智能ETF华夏

股票型

科技

21.79%

近6月涨幅

基金经理：单宽之

查看详情

电网设备ETF华夏（159326）：是全市场唯一跟踪中证电网设备主题指数的产品，申万二级行业中电网设备含量超77%，为全市场最纯的电网指数；其中智能电网权重占比高达90%，特高压权重占比高达69%，均居全市场首位。从申万三级行业分类上看，指数成分股的行业分布以输变电设备、电网自动化设备、线缆部件及其他、通信线缆及配套、配电设备为主，拥有较强的代表性。

风险提示：

以上基金风险等级为R4(中高风险)，具体风险评级结果以基金管理人和销售机构提供的评级结果为准。本资料仅为服务信息，不构成任何投资建议或承诺，也不作为任何法律文件。投资者在投资前，请务必仔细阅读基金的《基金合同》、《招募说明书》和《产品资料概要》等法律文件，充分认识本基金的风险收益特征和产品特性，并根据自身的风险承受能力理性决策。我国基金运作时间较短，不能反映股市发展的所有阶段。市场有风险，入市需谨慎。

费用重要提示：以上所提及ETF均不收取申购费、赎回费、销售服务费。申购赎回 *** 机构可按照不超过0.5%的标准收取佣金，其中已包含证券交易所、登记结算机构等收取的相关费用。此外，相关ETF的管理费率和托管费率均从基金资产中扣除，具体费率如下表所示。

上一篇：野村：在通胀压力下美联储降息或推迟至9月

下一篇：LME伦铝日内涨超5.00%，现报3461.295美元/吨

AI的尽头是token（词元）？一文读懂

相关文章