阿里云推“峰谷Token”:大模型夜间推理成本直降80%?

2026年6月24日中午,阿里云正式推出名为“峰谷Token”的新型计费机制,针对其QoderWork平台上的大模型推理服务实施错峰定价策略。根据公告,用户在每日晚间22:00至次日08:00期间调用Qwen3.7-Max模型,可享受低至原价2折的优惠,即仅需支付白天20%至40%的积分消耗。该机制覆盖QoderWork、QoderDesktop及命令行接口(CLI)等产品线,支持用户预设定时任务或提交长程指令,由AI代理(Agent)在夜间自动执行全流程,次日晨间即可获取结果。此举标志着阿里云首次将电力行业的“峰谷电价”逻辑系统性引入生成式AI服务领域,试图通过时间维度的价格弹性优化算力资源分配。

错峰计费:从电力逻辑到AI算力的新适配

“峰谷Token”的核心创新在于将传统能源领域的负荷管理思维迁移至云计算与大模型服务场景。在电力系统中,峰谷电价通过价格信号引导用户在用电低谷期消费,从而平抑电网负荷、提升基础设施利用率。阿里云此次将这一机制应用于Qwen3.7-Max等高算力需求模型,本质上是对GPU集群闲置时段的价值再挖掘。夜间通常是全球多数区域的企业计算负载低谷期,尤其对于以中国为主要服务市场的云厂商而言,欧美工作时段结束后的本地深夜存在大量未被充分利用的算力资源。

通过设置22:00至08:00为“谷时”,阿里云不仅匹配了中国用户的作息习惯,也间接覆盖了部分亚太地区的非高峰时段。用户若能将批量推理、模型微调或数据处理等非实时任务调度至该窗口,即可显著降低使用成本。例如,一项原本需消耗1000积分的日间任务,在夜间执行仅需200至400积分。这种设计尤其利好科研机构、中小企业开发者及高频实验型用户——他们往往受限于预算,但对模型性能有较高要求。

值得注意的是,该机制并非简单的时间折扣,而是与“Token”概念深度绑定。尽管当前公告未详述“峰谷Token”是否为独立代币或仅是内部计费单位,但结合阿里云近期与上海阿贝数字科技(Shanghai Able Digital)的合作动向,这一命名可能暗示更广泛的“知识Token化”战略。2026年6月22日,双方签署框架协议,明确将共同探索“基于Token的大模型知识赋能”及“物理AI研发”。虽然该合作聚焦教育与工业智能场景,但“峰谷Token”的推出可视为阿里云在消费端率先落地Token经济模型的尝试,即将算力消费行为与可量化、可激励的数字凭证挂钩。

行业背景:错峰定价在云服务中的演进与局限

尽管阿里云此次动作具有鲜明的创新标签,但错峰计费在云计算领域并非全新概念。过去十年,主流云厂商已普遍提供“竞价实例”(Spot Instances)或“节省计划”(Savings Plans),允许用户以折扣价使用闲置算力,代价是任务可能被中断或需承诺长期使用。然而,这些模式多面向底层IaaS(基础设施即服务),如虚拟机或存储,较少直接嵌入PaaS(平台即服务)或MaaS(模型即服务)层。

生成式AI的爆发改变了这一格局。大模型推理的算力消耗呈指数级增长,且具有高度波动性。据公开数据显示,单次Qwen3.7-Max级别的推理请求所消耗的GPU时长可能是传统API调用的数十倍。在此背景下,云厂商亟需更精细的资源调度工具。“峰谷Token”的独特之处在于,它将价格弹性与用户体验无缝结合——用户无需修改代码架构,只需调整任务触发时间,即可获得确定性折扣,且无服务中断风险。这比传统的竞价实例更贴近开发者实际需求。

横向对比,目前尚未有其他主流云厂商推出类似针对大模型的时段性折扣产品。亚马逊AWS的SageMaker虽支持异步推理和批量处理,但未按小时划分价格层级;微软Azure的AI服务亦主要依赖预留容量折扣。阿里云此举或将在短期内形成差异化竞争优势,尤其在价格敏感型市场。不过,该模式的有效性高度依赖用户行为的可调度性。对于需要实时响应的应用(如客服对话、内容审核),夜间折扣几乎无用武之地。因此,“峰谷Token”更可能成为补充性选项,而非主流计费方式。

潜在影响:成本结构重塑与生态协同效应

从企业用户视角看,“峰谷Token”有望显著优化AI项目的TCO(总拥有成本)。假设一个团队每日需运行100次Qwen3.7-Max推理任务,若全部安排在夜间,年化成本可降低60%以上。这种节省不仅释放预算空间,还可能催生新的工作流设计范式——例如,将数据预处理、模型训练与结果验证拆分为昼夜接力流程,由不同Agent协同完成。

更深远的影响可能体现在阿里云生态的协同强化上。QoderWork作为其AI开发平台,集成Agent编排、模型调用与任务管理功能。“峰谷Token”的引入将进一步提升该平台的粘性,促使用户将更多AI工作负载迁移至阿里云体系内闭环运行。同时,结合与上海阿贝数字科技合作中提到的“多智能体平台Polymas”,夜间低谷期或成为复杂Agent协作的理想试验场——多个AI代理可在低成本环境下并行执行子任务,最终整合输出,这在教育、工业仿真等长周期场景中极具潜力。

然而,挑战同样存在。首先,用户需具备一定的任务调度能力,这对中小开发者构成技术门槛。其次,全球分布式团队可能因时区差异难以统一利用“谷时”。此外,若夜间需求激增导致资源紧张,折扣力度或随供需动态调整,削弱价格确定性。阿里云需在初期严格保障资源冗余,以兑现“低至2折”的承诺,否则可能引发信任危机。

展望:AI服务定价进入精细化时代

阿里云“峰谷Token”的推出,标志着大模型服务正从粗放式按量计费迈向多维动态定价阶段。未来,类似机制或进一步细化——例如按周内工作日/周末划分、结合区域电力成本浮动定价,甚至引入用户贡献闲置算力换取折扣的共享经济模式。随着AI基础设施竞争加剧,价格策略将成为云厂商争夺开发者心智的关键战场。

在当前全球科技股承压、企业IT支出趋于审慎的宏观环境下(截至2026年6月,恒生科技指数年内下跌约18%),成本优化工具的价值愈发凸显。阿里云此举不仅回应了市场需求,也为其Qwen系列模型的商业化铺设了更具弹性的路径。若“峰谷Token”能成功验证其资源调度效率与用户接受度,不排除该模式将扩展至其他AI产品线,甚至反向影响底层IaaS的计费逻辑。

对于投资者而言,这一创新虽不直接改变阿里云的营收结构,但可能加速其AI服务的渗透率,尤其在价格敏感的新兴市场。长期看,谁能更高效地将闲置算力转化为可货币化的服务单元,谁就可能在下一代AI基础设施竞争中占据先机。而“峰谷Token”,正是这一逻辑的初步实践。

发布于
免责声明:市场有风险,投资需谨慎,本文不构成投资建议
BiyaPay
BiyaPay 让数字货币流行起来
BiyaPay的电报社区BiyaPay的Discord社区BiyaPay客服邮箱BiyaPay Instagram官方账号BiyaPay Tiktok官方账号BiyaPay LinkedIn官方账号
规管主体
BIYA GLOBAL LLC
美国证监会(SEC)注册的持牌主体(SEC编号:802-127417);美国金融业监管局(FINRA)的认证会员(中央注册登记编号CRD:325027);受美国金融业监管局(FINRA)和美国证监会(SEC)监管。
BIYA GLOBAL LLC
在美国财政部下设机构金融犯罪执法局(FinCEN)注册为货币服务提供商(MSB),注册号为 31000218637349,由金融犯罪执法局(FinCEN)监管。
BIYA GLOBAL LIMITED
BIYA GLOBAL LIMITED 是新西兰注册金融服务商(FSP), 注册编号为FSP1007221,同时也是新西兰金融纠纷独立调解机制登记会员。
©2019 - 2026 BIYA GLOBAL LIMITED