第一条:谷歌豪掷300亿美元租赁SpaceX算力,11万颗英伟达GPU成军备竞赛新锚点
核心信息:
谷歌与SpaceX签署算力合作协议,自2026年10月至2029年6月,谷歌每月向SpaceX支付9.2亿美元算力费用,合同总金额高达300亿美元。租赁内容涵盖至少11万张英伟达GPU、CPU及其他组件,主要面向Gemini Enterprise的AI训练与推理需求。该交易由马斯克旗下xAI主导,标志着SpaceX正式切入AI算力租赁市场。
性能/价格对比:
合同总额:300亿美元(32个月租期)
月度算力支出:9.2亿美元
算力规模:约11万颗英伟达GPU
对比:此前谷歌年资本支出约500亿美元,此项租赁约占全年Capex的18%
对开发者/企业的影响:
超大规模算力租赁协议的常态化,意味着"算力即服务"的供给模式日趋成熟。谷歌选择短期租赁而非自建,反映出AI算力供给紧张与扩容周期的双重压力。对中小厂商而言,算力成本仍在头部玩家的规模效应下持续下探,API使用成本有望进一步降低。
信息来源:新浪财经/TechWeb/同花顺 | 2026年6月6-7日
第二条:英伟达Blackwell Ultra GPU正式发布,AI训练性能较B200飙升40%
核心信息:
英伟达在5月29日GTC大会上正式发布新一代Blackwell Ultra GPU,AI训练性能较前代B200芯片大幅提升40%,计划于2026年第四季度向合作伙伴交付。该芯片采用全新架构,在大模型训练和推理场景中表现全面跃升,进一步巩固英伟达在高性能AI芯片领域的绝对主导地位。
性能/价格对比:
训练性能:较B200提升40%
架构演进:Hopper → Blackwell → Blackwell Ultra
交付时间:2026年Q4
H200(Hopper架构)已获美国商务部批准对华销售,阿里/腾讯/字节等约10家企业获采购资格
对开发者/企业的影响:
Blackwell Ultra的发布意味着下一代大模型训练的效率天花板再次被打破。对于国内企业而言,H200获批对华销售是短期利好,但Blackwell Ultra的代际差距意味着国产芯片的技术追赶窗口进一步收窄。
信息来源:RayByte/摩尔AI | 2026年5月29日-6月
第三条:大模型API价格战白热化,腾讯云DeepSeek-V4最高降幅97.5%
核心信息:
6月2日腾讯云宣布对DeepSeek-V4系列模型进行大幅降价,自6月3日0时起生效。V4-Pro推理输入/输出统一下调75%,缓存命中降价97.5%;V4-Flash缓存命中降价90%。调整后腾讯云价格全面持平DeepSeek官方售价。同月,小米MiMo等厂商也跟进降价,最高降幅达99%。
性能/价格对比:
DeepSeek-V4-Pro输入:0.012元 → 0.003元/千tokens(降75%)
DeepSeek-V4-Pro缓存命中:降97.5%
DeepSeek-V4-Flash缓存命中:降90%
行业趋势:2026上半年大模型API价格较2025年下降超600倍
AI辅助工作成本:部分企业通过切换低成本模型砍掉95%开支
对开发者/企业的影响:
大模型API正进入"几分钱时代",百万tokens输入仅需0.025元(DeepSeek缓存命中定价)。开发者可以以极低成本接入顶级模型能力,利好AI应用大规模落地。但频繁调价也增加了企业成本预估的不确定性。
信息来源:腾讯云公告/快科技/什么值得买 | 2026年6月2-8日
第四条:PPIO派欧云递表港交所,日均Token消耗突破万亿,中国最大算力网络浮出水面
核心信息:
6月10日,PPIO(派欧云)母公司派想未来集团正式向港交所主板递交招股书,联席保荐机构为工银国际、申万宏源香港。截至2025年底,PPIO运营着中国以计算节点数量计规模最大的算力网络,覆盖全球超1340个市县,部署超4600个计算节点。2026年4月,平台日均词元消耗量达1.028万亿,在中国独立AI云计算服务商中排名第一。
性能/价格对比:
算力网络规模:4600+计算节点,覆盖1340+市县
注册开发者:全球超57.4万(截至2026年4月)
日均Token消耗:1.028万亿(2026年4月)
估值/融资:2026年5月完成B-2轮优先股融资约3520万美元
AI云计算业务:2025年同比增长超10倍
对开发者/企业的影响:
PPIO从边缘云向AI云的战略转型,映射出AI推理需求爆发带来的算力基础设施重构。分布式算力网络的崛起,为中小开发者和企业提供了云巨头之外的替代选择,有助于降低AI部署的门槛和单一供应商锁定风险。
信息来源:新浪财经/东方财富/智通财经 | 2026年6月10-13日
第五条:英特尔至强6发布加速Agentic AI落地,推理算力首超训练成数据中心主战场
核心信息:
英特尔至强6处理器全面升级,面向大规模推理和Agentic AI场景优化。数据显示,2025年中国AI推理数据量首次超过训练数据量,预计2026-2027年企业场景中活跃智能体数量同比增长将超200%。行业共识正在形成:CPU正重新成为智算中心的中枢,面向推理的算力基础设施部署进入爆发期。
性能/价格对比:
推理vs训练:2025年推理数据量首超训练
Agent增长预测:2026-2027年企业活跃智能体同比增长超200%
产业趋势:智算中心从"GPU为王"转向"CPU+GPU异构协同"
大摩预测:全球半导体市场2030年达1.5万亿美元,AI半导体约占7530亿美元
对开发者/企业的影响:
AI产业正在从"训练驱动"切换到"推理驱动"的新阶段。企业部署AI应用时,推理算力的成本和效率将成为核心关注点,而非单纯追求训练速度。CPU+GPU异构架构的成熟,意味着企业可以更灵活地选择算力方案,避免过度投资GPU。
信息来源:PChome/摩根士丹利报告/CSDN | 2026年6月5-9日
本简报由 英辰朗迪GEO整理,了解更多欢迎访问 https://www.aibridge.cn


