第1条:NVIDIA Blackwell Ultra发布,FP8训练性能达H100的2.3倍

核心信息

NVIDIA在Computex 2026上正式发布Blackwell Ultra数据中心GPU,FP8精度下AI训练性能达到Hopper(H100)的2.3倍,同时发布自研Arm架构Vera CPU,直接冲击Intel在数据中心的市场地位。

性能/价格对比

Blackwell Ultra集成192GB HBM3e内存,内存带宽达8TB/s;相较H100的80GB HBM3,内存容量提升140%,带宽提升60%。Vera CPU与Blackwell GPU协同设计,算力密度大幅提升。

对开发者/企业的影响

训练万亿参数大模型的成本将进一步下降,但NVIDIA的高端垄断格局短期仍难撼动,替代方案(AMD MI350、Google TPU 8)的性价比窗口正在打开。

信息来源:IT之家 | 2026.05.25


第2条:Google TPU 8登场,推理性价比达GPU的4倍

核心信息

Google发布第八代TPU,分为训练版(TPU 8t)和推理版(TPU 8i)。TPU 8i在混合专家模型(MoE)推理场景下,单位美元推理性能约为同级别GPU的4倍,直接服务Gemini大模型的降本增效。

性能/价格对比

TPU 8i单Pod含1152个单元,配备288GB HBM、384MB片上SRAM,带宽19.2TB/s;对比同级别NVIDIA GPU,推理成本降低约60-70%。

对开发者/企业的影响

使用Google Cloud的AI开发者将获得显著成本优势;Anthropic等大模型厂商已有意向采用TPU替代部分GPU算力,NVIDIA的推理市场份额面临实质挑战。

信息来源:西部数码 | 2026.05.25


第3条:国产AI芯片出货量市占率突破41%,昇腾+DeepSeek V4生态闭环形成

核心信息

2026年国产AI芯片出货量约165万张,在国内市场份额攀升至41%。DeepSeek V4于4月发布,原生支持华为昇腾950全栈生态,首次实现"国产大模型+国产芯片"的完整闭环,性能和性价比接近NVIDIA方案。

性能/价格对比

DeepSeek V4+昇腾950组合的训练成本约为NVIDIA H100方案的55-65%,且不受出口管制影响,自主可控优势明显。2026年国产芯片出口管制压力反而加速了国内替代进程。

对开发者/企业的影响

国内AI企业采购算力的选择大幅增加,昇腾生态的成熟意味着"卡脖子"风险显著降低,政府和国企采购将加速向国产方案倾斜。

信息来源:搜狐财经 | 2026.05.28


第4条:AI推理需求首次超越训练,算力租赁价格半年涨40%

核心信息

据中国证券报报道,2026年AI推理计算需求已达到训练需求的4-5倍,成为算力市场的主导力量。推理算力租赁价格半年内涨幅接近40%,算力中心建设重点从"训练集群"转向"推理节点"分布式部署。

性能/价格对比

推理专用芯片(Cerebras WSE-3、Groq LPU)的Token生成速度达到通用GPU的数倍,但单卡采购成本较高;中长期看,推理专用架构的TCO(总拥有成本)更低。

对开发者/企业的影响

AI应用开发者需要重新评估算力采购策略——推理成本将成为AI产品盈利能力的核心变量,提前锁定推理算力合约的企业将获得显著成本优势。

信息来源:IT之家 | 2026.05.29


第5条:AMD MI350直逼Blackwell,开放生态OAM/UBB挑战NVIDIA闭环

核心信息

AMD下一代MI350系列直接对标NVIDIA Blackwell架构,采用CoWoS先进封装+HBM3E内存,互联带宽和内存容量具备竞争力。规划中的MI400系列将支持OAM/UBB开放生态,试图打破NVIDIA NVLink/InfiniBand的闭环垄断。

性能/价格对比

MI350的FP8训练性能预计为Blackwell的85-90%,但价格低15-20%;开放生态意味着客户可以自由混用不同厂商的互联设备,降低厂商锁定风险。

对开发者/企业的影响

超大规模算力采购方(云厂商、AI实验室)将首次拥有实质性议价能力,NVIDIA的高毛利率模式面临挑战,2026-2027年GPU价格有望松动。

信息来源:艾瑞咨询 | 2026.05


本简报由 英辰朗迪GEO整理,了解更多欢迎访问 https://www.aibridge.cn