第1条:DeepSeek-V4-Pro API永久降价75%,创全球大模型价格新低

核心信息

DeepSeek官方宣布,V4-Pro模型API价格于2026年5月31日结束2.5折优惠后,正式永久调整为原定价的四分之一,而非此前计划的恢复原价。调价后输入(缓存命中)仅0.025元/百万Token,相当于免费级别,为全球主流大模型最低价。

性能/价格对比

模型

输入(缓存命中)

输入(未命中)

输出

DeepSeek-V4-Pro(新)

0.025元

3元

6元

OpenAI GPT-4o

~18元

~18元

~72元

Claude Sonnet 4.6

~21.6元

~21.6元

~108元

通义千问Qwen3.5-Plus

0.8元

0.8元

1.6元

对开发者/企业的影响

API成本大幅下降,中小开发者和初创团队的AI应用准入门槛显著降低;行业竞争逻辑从价格战回归架构创新与算力优化,厂商需在极低价下保持服务质量才能立足。

信息来源:搜狐/财新网/腾讯新闻 | 2026-05-25~31


第2条:微软Azure Athena-3超算上线,十万Blackwell Ultra GPU打造100 EFLOPS算力

核心信息

2026年5月27日,微软在Build年度开发者大会上正式宣布Azure云平台上线Athena-3超级计算机,集成10万颗英伟达Blackwell Ultra GPU,整体算力达100 EFLOPS,是上一代Athena-2的5倍。系统部署于美国华盛顿州耗资超50亿美元扩建的数据中心,电力容量超500兆瓦。

性能/价格对比

  • Athena-3 整体算力:100 EFLOPS(Athena-2 约 20 EFLOPS)

  • 单颗 Blackwell Ultra GPU:8 PetaFLOPS AI算力

  • 企业客户可通过Azure弹性获取十万GPU级别算力,无需自建超算中心

对开发者/企业的影响

万亿参数大模型训练、AI+科学计算等极端算力需求得以在公有云上实现;中小团队可通过按需租用方式获取以往只有科技巨头能负担的算力规模,降低AI研发门槛。

信息来源:AISort.net / CSDN | 2026-05-27


第3条:硅谷陷入算力荒——H200一夜涨价30%,H100排期到2027年

核心信息

2026年5月,硅谷AI算力"饥荒"达到前所未有高度。H200现货价格一夜从4.96美元/小时涨至6.40美元/小时,涨幅29%,价格甚至超过新一代B200(5.68美元/小时)。H100一年期合约租金半年内上涨近40%(1.70→2.35美元/小时)。国内某云厂商H100排期已到2027年第一季度

性能/价格对比

GPU型号

现货价格(美元/小时)

涨幅

H200(现货)

6.40

+29%(一夜)

B200(现货)

5.68

基准

H100(一年合约)

2.35

+40%(半年)

H100(两年前)

~2.00

基准

对开发者/企业的影响

AI民主化进程受阻——算力从基础设施变成筛选机制,大量普通开发者、高校研究员被高门槛排除;企业倾向签长期合约囤卡(即使闲置),进一步加剧算力流动性枯竭,形成"短缺→恐慌→囤积→更短缺"的恶性循环。

信息来源:36氪 / 雪球 | 2026-05-20


第4条:2026年中国智能算力规模达1460 EFLOPS,A股百亿订单井喷

核心信息

据行业数据,2026年中国智能算力规模预计达1460.3 EFLOPS,为2024年(约730 EFLOPS)的2倍。算力租赁市场景气度高企,A股上市公司密集抛出亿元级算力采购订单:东阳光(600673.SH)控股子公司签署《算力服务采购框架合同》,合同预计总金额高达160亿至190亿元;华策影视、赛意信息等同步跟进。

性能/价格对比

  • 2024年中国智能算力:约730 EFLOPS

  • 2026年预计:1460.3 EFLOPS(+100%

  • 2025年云计算相关企业注册量:17.1万家(创十年新高,同比+19.8%)

  • 截至2026年5月,云计算相关专利累计3.0万项(发明专利占近90%)

对开发者/企业的影响

国内算力供给持续扩张,但高端GPU(H100/H200)仍受出口管制影响,国产算力替代(华为昇腾、天数智芯等)进入"从推理走向训练"的关键窗口期;企业算力采购成本因供需紧张维持高位,租赁市场价格短期难以回落。

信息来源:新浪财经 / IDC | 2026-05-22


第5条:英伟达GTC台北:Vera Rubin NVL72亮相,单系统200万零部件、推理成本降至1/10

核心信息

2026年5月23-26日,英伟达CEO黄仁勋在台北国际电脑展(COMPUTEX 2026)期间披露下一代Vera Rubin平台详情:Vera Rubin NVL72机架级AI超级计算机集成36颗Vera CPU + 72颗Rubin GPU,单系统由近200万个零部件组成,是英伟达历史上规模最大的产品发布。推理吞吐量最高提升10倍,每Token成本降至上一代平台的十分之一

性能/价格对比

指标

Vera Rubin NVL72

上一代(Hopper/B200)

推理吞吐量

提升10倍

基准

每Token成本

降至1/10

基准

单系统零部件数

200万个

显著减少

能效(含Groq 3 LPX)

提升35倍(每瓦特)

基准

同期发布的Jetson Thor边缘AI平台基于Blackwell架构,AI算力达2070 FP4 TFLOPS,相比上一代Jetson Orin性能提升7.5倍,能效提升3.5倍

对开发者/企业的影响

Vera Rubin平台将大幅降低大模型推理成本,使实时AI应用(代码补全、对话AI、Agent推理)的经济可行性显著提升;Jetson Thor将物理AI(机器人、自动驾驶、工业视觉)的端侧算力提升到新水平,加速边缘智能落地。黄仁勋主题演讲定于2026年6月1日11:00(北京时间)直播。

信息来源:NVIDIA官方博客 / CSDN | 2026-05-23~26


本简报由 英辰朗迪GEO整理,了解更多欢迎访问 https://www.aibridge.cn