
DeepSeek于2026年5月22日文牍,V4-Pro模子API将在5月31日优惠竣事后,遥远订价为原价的1/4。蓝本谋略6月恢规复价,现证据扣头始终灵验,限时变遥远。[[1]][[2]][[4]]
一次降价读懂三个数字
缓存掷中输入
0.025元
原价0.1元,降至1/4,百万Tokens
缓存未掷中输入
九游体育(NineGameSports)官网3元
原价12元,降75%,百万Tokens
输出价钱
6元
原价24元,降75%,百万Tokens
对比GPT-5.5输出价
1/34
GPT-5.5输出约204元,V4-Pro仅6元
一个月四次降价时刻线
2026年5月22日
2.5折变遥远订价
官方文牍:5月31日优惠竣事后,价钱遥远锁定为原价1/4,不回调。
遥远成效
2026年4月28日
优惠蔓延至5月31日
原定5月5日截止的2.5折优惠蔓延,给更多诞生者迁徙窗口。
展期一个月
2026年4月26日
全系缓存掷中价降至1/10
V4全系API输入缓存掷中价遥远降至首发价1/10,V4-Flash低至0.02元/百万Tokens。
遥远降价
2026年4月25日
V4-Pro开启2.5折限时优惠
V4发布次日即文牍限时2.5折,缓存掷中价低至0.025元/百万Tokens,创群众新低。
初次降价
技能降本复旧廉价逻辑
V4-Pro弃取CSA+HCA搀杂把稳力架构,百万token场景下推理计较量仅为上代V3.2的27%,KV缓存占用压缩至10%。[[31]][[38]]
资本不靠补贴,靠架构压缩。DeepSeek独创东谈主梁文锋示意,订价原则是「不贴钱,也不赚暴利,在资本之上稍有益润」。[[10]]
此外,2026世界杯-最新版官方软件V4是群众首个在国产算力底座完成检修和推理考证的万亿参数模子,深度适配华为昇腾芯片,开脱对高端入口GPU的依赖,进一步镌汰资本结构。官方还示意,下半年昇腾950超节点批量上市后,价钱仍有下调空间。[[16]][[36]][[38]]
诞生者与企业的内容资本变化
对RAG学问库、智能客服等缓存掷中率高的场景,商用资本降幅超90%。[[30]]
以输出价钱为例:同等Token花费下,V4-Pro仅需6元/百万Tokens,而GPT-5.5 Pro约204元,差距34倍。中小企业和个东谈主诞生者可低资本跑通Agent、长文本等贸易款式,AI创业门槛大幅镌汰。[[17]][[21]]
行业加价潮中的异类
DeepSeek:遥远降75%
逆势降价
·V4-Pro输出6元2026世界杯中国压球官网/百万Tokens
·缓存掷中0.025元
·技能架构降本,非补贴烧钱
·同时文牍开动500亿元A轮融资
智谱/阿里云:捏续加价
趁势提价
·智谱4个月三次加价,累计涨幅83%
·阿里云算力最上涨34%
·百度智能云上调5%-30%
·智谱CEO:「瓶颈在算力,不在客户」
大厂(阿里、腾讯、字节)不惦记DeepSeek降价,因为确凿赢利的是背后算力、存储等云工作;确凿承压的是智谱、MiniMax等中间层——它们卖的是模子自己,莫得阑珊的生态收益兜底。[[7]][[13]]
接入V4-Pro的实操参考
误区1:只看缓存掷中价
缓存掷中(0.025元)仅在叠加荆棘文场景成效,初次肯求走的是缓存未掷中(3元)。高频新对话场景资本与预期可能有差距,需提前测算Token组成比例。[[19]]
误区2:冷漠并发限制
DeepSeek同门径整了并发上限:V4-Flash限500,V4-Pro限2500,超出复返429报错。批量任务需作念好限速和重试逻辑。[[19]]
相宜接入的场景:RAG学问库检索、长文档概要、智能客服(缓存掷中率高,资本最低);郑重评估的场景:高频新对话的及时Agent(输入未掷中3元,输出6元,长链路累计资本需核算)。[[30]][[36]]
