找回密码
 立即注册
查看: 955|回复: 3

AI遇上最强春节档 Token通胀已成必然?

[复制链接]

4077

主题

535

回帖

1万

积分

论坛元老

积分
12921
发表于 2026-2-15 22:37:01 | 显示全部楼层 |阅读模式
  专业金融数据,下一代智能终端$ R! Q* J% a' P, n. ]
                                                              2026年马年春节,互联网大厂的“红包战”如期上演。百度撒下5亿,腾讯元宝豪掷10亿,阿里更是祭出30亿免单的“钞能力”。不过“撒钱”只是“开胃菜”,紧随而来的则是参与者更多、频率更密集的国产AI新品“春节档”:( h3 l# o  I9 u& e4 ~
  2月14日,字节跳动发布豆包大模型2.0系列,这是继Seedance 2.0视频模型和Seedream 5.0 Lite图像模型之后打出的春节“第三弹”。智谱已在2月11日发布“系统架构师”级别的底座模型GLM-5;MiniMax紧随其后,于2月12日上线并开源文本模型M2.5;连一向低调的DeepSeek,也在几天前进行版本更新。在此之前,阶跃星辰发布Step 3.5 Flash,阿里发布Qwen3-Coder-Next,且有望在春节期间发布Qwen 3.5。, }* O5 e) n: y# e, r6 L
  每一次发布都是一次卡位,每一次迭代都是一次重塑行业格局的尝试。这一波覆盖文本、图像、视频多模态的AI“最强春节档”已经拉开大幕。/ E) q3 o9 t7 a4 C
zSEQjxzzxX1wQyhS.jpg
- @1 e) N7 p: u- @
+ _/ C# G; \0 l3 P5 G! s* C4 L

  t: C$ J; s  y! f' U- {1 Z, U8 [, M  ▌多模态大模型接连面世 Token需求出现“通胀”& o" u. L- I2 `* b5 `
  一年多前,字节内部曾判断,AI对话类产品可能只是AI产品的“中间态”,长期更理想的产品形式,大概率需要更视觉化的用户体验、更低的用户使用门槛。因此彼时的字节选择提升即梦的产品优先级,尝试打造“AI时代的抖音”。4 e  W( c, i# \9 \- S; Q) ]# n* Y
  或许也正是因此,一年多以后,在字节的这次春节档“三连弹”中,最先出场的不是最为大众所熟悉的豆包,而是视频模型Seedance 2.0。
% J- G0 z  ]. w3 b  而从曾经和文本大模型的“聊几秒”到如今视频大模型的“看几秒”,算力消耗规模正在快速膨胀——从单条视频来看,Seedance 2.0 生成一条10秒、1080p的视频,大致要消耗35万token。
4 g% X& F9 u) }( x1 j8 ~3 w) n: z  Seedance 2.0的算力消耗增长并非孤例。春节档的这轮密集发布,对各家厂商而言不仅是品牌宣传的窗口期,也是一场对底层算力储备的极限压力测试。随着越来越多的多模态和长文本大模型面世,势必将进一步推高Token需求。
  b" e5 G6 A7 T% D# J9 L  国联民生证券指出,Token需求正在发生“通胀” 。这种“通胀”并非是指Token本身变贵,而是指单位时间内、单位用户的Token消耗结构性上升。+ L% Y: `) E+ Q0 k- f* W- B9 G- f
  数据显示,火山引擎的大模型日均Token调用量已从2024年底的2万亿增长至2025年底的63万亿;阿里云外部客户2025年日均Token调用也已接近5万亿,2026年目标至少15-20万亿,内部业务日均调用则计划从16-17万亿拉到100万亿。从全行业看,中国整体日均Token消耗2024年初为1000亿,2025年中突破30万亿,2026年2月主流大模型合计日均Token消耗已到180万亿级别。
0 a3 ]7 v4 X3 k/ S' N- D' C lhsNBl2h7lm78jb2.jpg   图|不同模型token调用量(来源:海通国际证券)- N* E. Y5 |9 r0 I
  摩根大通指出,春节AI应用推广战仅是表面,在这背后更深层的趋势在于,消费者获取信息和消费内容的方式正在经历结构性变革,这一进程实际上推升了推理量,将驱动Token消耗量步入一个长达数年的高速增长期。
' h3 M/ T$ m$ Z# M( F/ J  其预测,中国的AI推理Token消耗量预计将从2025年的约10千万亿增长至2030年的约3900千万亿,五年间增长约370倍。  F% {0 g4 O1 V# {- r
  ▌Token成为“计量单位” 产业链开启涨价
" m: y9 s7 ~# l9 K2 q% X9 N$ }  今年以来,全球云计算市场进入密集涨价周期。先是亚马逊云宣布上调EC2机器学习容量块价格约15%;之后谷歌云宣布北美、欧洲、亚洲地区全部涨价;国内厂商迅速跟进:优刻得宣布全线产品与服务价格上浮。
/ k( X' f6 K0 }0 N& S; A  随后,智谱打响了年内大模型涨价“第一枪”。2月12日,其宣布GLM Coding Plan套餐价格体系结构性调整,取消首购优惠,保留按季按年订阅优惠,套餐价格整体涨幅30%起。官方解释是“市场需求持续强劲增长,用户规模与调用量快速提升,为保障高负载下的稳定性与服务质量,同步加大算力与模型优化投入”。之后GLM Coding Plan上线即售罄。
- k3 Y; j* S6 W6 c' g  国联民生证券指出,智谱此前正因为用户增长导致算力阶段性紧张,对Coding Plan做过“限量发售”安排,这与其后续涨价形成了一个非常典型的“供需链条”:需求在短期内大幅增长→资源呈现刚性约束(导致限流/限量)→涨价。
' I1 d& P8 W0 o4 U0 e  在分析师看来,当行业依旧处在“模型价格战”时,智谱给出的涨价信号,意味着大模型时代的“计量单位”从流量(DAU/时长)转向Token(推理消耗),而Token消耗在越来越多场景里是刚需。综合来看,Token需求“通胀”不仅利好云端算力,也让模型厂商拥有了议价权;同时产业定价逻辑也发生改变,当推理消耗变成生产资料,模型厂商有机会把“算力稀缺”通过分层定价与订阅化产品转化为毛利与现金流。' Z& a( T1 G$ F" Z) J
  落实到投资方向上,券商建议关注:* z6 i8 K3 L5 m1 V3 M) n- W; n; B
  第一,云厂商与算力基础设施:AI拉动的IT支出与基础设施投入仍处上行周期,云侧将受益于GPU算力、存储与网络I/O等“伴随型消耗”的持续增长。! ?, j# S+ L1 h& k' W% z9 U
  第二,大模型厂商:当它们能在编程、Agent、企业流程等高ROI场景中维持订阅留存与企业席位扩张,能把“Token用量”稳定转成“省人省时省返工”的交付价值时,就具备了穿越开源与价格战的能力。+ I% p+ `& s( B. f* q$ L( `: N
  第三,安全治理与运行时的防护工具:随着企业把AI嵌入工作流,数据泄露、代理越权等风险将推动“AI安全平台/治理平台”成为刚需层。; p3 H. O5 T1 u- X8 `
  全新妙想投研助理,立即体验9 e* B; S3 W- M4 Z) l: T5 o) E
(文章来源:科创板日报)
集群智慧云科服专利申请服务

74

主题

2196

回帖

6841

积分

论坛元老

积分
6841
发表于 2026-2-15 22:57:11 | 显示全部楼层
润泽科技
集群智慧云科服SCI/SSCI/EI期刊发表服务

74

主题

2196

回帖

6841

积分

论坛元老

积分
6841
发表于 2026-2-15 23:17:04 | 显示全部楼层
专家又在玩忽悠,仙人跳,哪个说的,留下单位,姓名,看到时候砸不洗你

30

主题

440

回帖

1420

积分

等待验证会员

积分
1420
发表于 2026-2-15 23:37:24 | 显示全部楼层
算力是新电力,新石油
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


快速回复 返回顶部 返回列表