第1条:Google×SpaceX签300亿美元天价算力合约:月付9.2亿租11万GPU
核心信息:
6月6日,Google与SpaceX达成重磅云计算协议——自2026年10月至2029年6月,Google每月向SpaceX支付9.2亿美元(约合62.5亿人民币),总合同金额高达300亿美元,租用至少11万张NVIDIA GPU及配套CPU、内存等算力资源。Google将此定位为Gemini Enterprise的过渡性算力储备,并非长期依赖。
性能/价格对比:
租用方 | GPU规模 | 月租费 | 合同期 |
11万张 | $9.2亿 | 2026.10-2029.06 | |
Anthropic | 22万张 | $12.5亿 | 至2029.05 |
SpaceX出租的是Colossus 1集群(混合H100/H200/GB200),因异构架构在Grok训练中效率不足,xAI已转向纯新一代GPU的Colossus 2,闲置算力借此变现。
对开发者/企业的影响:
300亿美元体量的算力租赁交易验证了GPU租赁市场的巨大空间,异构GPU集群的效率问题也促使市场对同构、新一代GPU集群支付更高溢价。企业级AI算力供给加速分层化。
信息来源:华尔街日报 / 财联社 | 2026-06-06
第2条:DeepSeek V4 Pro永久降价75%,腾讯云同步跟进最高降97.5%
核心信息:
DeepSeek于5月31日起将旗舰模型V4 Pro永久降价至原价的1/4,输入降至0.87/百万token。6月2日腾讯云立即跟进,对DeepSeek-V4系列全线降价,其中V4-Pro缓存命中资费降幅高达97.5%。V4 Flash缓存命中输入更是压至$0.0028/M这一史低价位。
性能/价格对比:
模型 | 输入价格/MTok | 输出价格/MTok | 缓存命中 | 1M上下文 |
DeepSeek V4 Pro(新) | $0.435 | $0.87 | $0.0036 | ✅ |
DeepSeek V4 Pro(旧) | ~$1.74 | ~$3.48 | - | ✅ |
DeepSeek V4 Flash | $0.14 | $0.28 | $0.0028 | ✅ |
GPT-5.5 Pro | $30 | $180 | - | ✅ |
对开发者/企业的影响:
旗舰推理模型进入"白菜价"时代。V4 Pro折扣后输出价0.87/M,配合缓存命中可降至0.0036/M——比很多自部署模型还便宜。国内开发者无需中转代理,延迟更低,重度使用场景成本可降低90%以上。
信息来源:DeepSeek官方 / 腾讯云公告 | 2026-05-31 / 06-02
第3条:Intel Computex 2026发布18A至强6+:288核CPU杀回AI推理C位
核心信息:
6月2日Computex 2026上,Intel发布基于18A制程的至强6+(Xeon 6+)处理器,搭载288个能效核和576MB三级缓存,专为云原生和智能体AI推理工作负载设计。CEO陈立武提出关键论断:AI训练时代CPU与GPU配比为1:4,在智能体推理时代将演变为1:1,CPU在任务编排与调度中重回核心地位。
性能/价格对比:
指标 | 数据 |
制程工艺 | Intel 18A |
核心数 | 288核 |
L3缓存 | 576MB |
Q1营收 | $136亿(超预期) |
AI业务占比 | 60% |
股价反应 | 收涨逾6%,约$115 |
Intel同步推出「机架级蓝图」(Rack-Scale Blueprint),联合富士康和SambaNova打造高CPU密度推理机架。供给端紧张:至强服务器芯片供需可能延续至2027年。
对开发者/企业的影响:
CPU在AI推理中的角色被重新定义——智能体任务(编排、调度、多Agent协调)对CPU的需求远超传统推理,Intel 18A至强6+为"去GPU化"推理方案提供了可行路径。企业可以更灵活地调配CPU/GPU比例,优化推理总成本。
信息来源:快科技 / 新浪财经 | 2026-06-02
第4条:Anthropic秘密递交IPO申请,9650亿美元估值领跑AI上市潮
核心信息:
6月初,Anthropic向SEC秘密递交S-1招股书,以9650亿美元估值冲刺史上最大AI IPO,预计募资超600亿美元,最快于2026年10月挂牌。这一估值已超越OpenAI同期8520亿美元,源于5月28日完成的650亿美元H轮融资(Altimeter Capital、红杉、Dragoneer联合领投,三星、SK海力士、美光等芯片厂商参投)。
性能/价格对比:
公司 | 估值 | 募资规模 | IPO进度 |
Anthropic | 9650亿$ | 600亿$+ | 秘密递表,最早10月 |
OpenAI | 8520亿$ | 待定 | 目标9月递表 |
SpaceX | 1.25-1.75万亿$ | 750-800亿$ | 路演中 |
财务亮点:Q2预计营收109亿美元、运营利润约5.59亿美元(创立以来首个盈利季度);Claude Code年化营收达25亿美元;推理毛利率从一年前38%飙升至70%以上。
对开发者/企业的影响:
AI第一股即将诞生,巨头上市将加速行业算力投资竞赛。Anthropic在招股书中明确将IPO募资主要用途指向自建数据中心(减少对外部算力租赁的依赖),这将重塑GPU供应链格局。
信息来源:SEC文件 / 东方财富 / 百家号 | 2026-06-03
第5条:Claude Opus 4.8发布:SWE-bench Pro 69.2%登顶,但身陷「蒸馏」争议
核心信息:
5月28日,Anthropic在42天的极短迭代后发布Claude Opus 4.8,SWE-bench Pro得分从64.3%跃升至69.2%,领先GPT-5.5(58.6%)超10个百分点,首次登顶Artificial Analysis Intelligence Index。同步推出Dynamic Workflows(Claude Code可协调数百子Agent并行执行)和2.5倍快速模式(输入10/MTok、输出50/MTok)。
性能/价格对比:
模型 | SWE-bench Pro | AA Index | 推理速度 | 快速模式价格 |
Claude Opus 4.8 | 69.2% | 61.4 | 标准 | 10/50 |
GPT-5.5 | 58.6% | 60.2 | 标准 | - |
Claude Opus 4.7 | 64.3% | - | 标准 | - |
但发布首日即陷争议:多位开发者裸API调用时,模型会自称「通义千问」或「DeepSeek」——尽管Anthropic此前公开指责国内公司对Claude输出进行「工业蒸馏」。截至发稿,Anthropic未正式回应此问题。
对开发者/企业的影响:
Opus 4.8的SWE-bench Pro成绩确认了Agent代码能力的新天花板,Dynamic Workflows为多Agent编排提供了原生能力。但蒸馏争议揭示了大模型训练数据治理的行业性难题——即使顶尖公司也难以完全排除训练数据污染风险。
信息来源:Artificial Analysis / AI信息Gap | 2026-05-31
本简报由 英辰朗迪GEO整理,了解更多欢迎访问 https://www.aibridge.cn


