英辰朗迪AI动态简报之算力基建篇

第一条：Gemini 3.5 Flash 发布——谷歌打出「价格砍半、速度4倍」组合拳

核心信息：

Google I/O 2026 上，谷歌发布新一代 Gemini 3.5 系列。Flash 版本以「不到同类前沿模型一半的价格」提供前沿级能力，输出 Token 速率达竞品 4 倍（Antigravity 平台优化后可达 12 倍）；企业若将 80% 日常负载迁移至此，年省 超 10 亿美元。

性能/价格对比：

指标	Gemini 3.5 Flash	竞品前沿模型
编程能力（GDPval-AA）	1656 Elo	低于该水平
终端任务（Terminal-Bench 2.1）	76.2%	50-60%（2025年水平）
智能体工具调用（MCP Atlas）	83.6%	—
输出速度	4-12倍	基准
成本	不到一半	—

对开发者/企业的影响：

谷歌正通过「前沿智能 + 极速推理 + 超低成本」三重优势，迫使竞争对手在定价和性能两端同时承压。结合谷歌 2026 年预计 1800-1900 亿美元资本支出，中小模型厂商的生存空间将进一步被压缩。

信息来源：钛媒体 / 凤凰网科技 | 2026-05-22

第二条：英伟达Q1财报炸裂——营收816亿美元，数据中心收入752亿同比增92%

核心信息：

英伟达发布 2027 财年 Q1 财报（截至 2026/4/26）：营收 816.15 亿美元（同比+85%），净利润 583.21 亿美元（同比+211%），毛利率保持 75%。数据中心业务收入 752 亿美元，占总营收 92%，其中来自超大规模客户的收入达 380 亿美元。

性能/价格对比：

指标	Q1 FY2027	同比变化	市场预期
总营收	816.15亿	+85%	789亿（超越）
净利润	583.21亿	+211%	—
数据中心收入	752亿	+92%	731亿（超越）
每股收益	$1.87	+140%	$1.76（超越）
下季度指引	910亿	—	870亿（超越）

对开发者/企业的影响：

黄仁勋明确表示 Vera Rubin 平台从 FY2027 下半年开始出货，且整个生命周期内将「供应紧张」。H100 芯片租赁价格年内已涨 20%，A100 涨近 15%——AI 算力供不应求的局面至少延续到 2027 年，企业应尽早锁定算力资源。

信息来源：澎湃新闻 | 2026-05-21

第三条：阿里云全栈升级——真武M890芯片 + Qwen3.7-Max + 千问云三箭齐发

核心信息：

5 月 20 日阿里云峰会，阿里巴巴一次性发布芯片-模型-平台三层升级：新一代自研 AI 芯片 平头哥真武 M890、旗舰模型 Qwen3.7-Max、面向 Agent 的 千问云官网，并对百炼平台进行优化。阿里云 MaaS 服务已实现盈利，日均 Token 收入增长 15 倍。

性能/价格对比：

层级	新品	关键看点
芯片层	真武 M890	搭载超节点服务器，阿里全栈自研 AI 芯片
模型层	Qwen3.7-Max	最新旗舰模型，面向 Agent 场景深度优化
平台层	千问云	适配 Agent 产品官网，对标 Google Antigravity
服务层	百炼	模型服务平台全面优化

对开发者/企业的影响：

阿里云成为国内首个完成「芯片-云-模型-推理」全栈闭环的厂商。真武 M890 的推出意味着阿里在 AI 芯片上进一步降低对英伟达的依赖，而千问云的上线标志着 Agent 应用从概念走向基础设施化。开发者和企业可关注百炼平台上的 Qwen3.7-Max API 接入。

信息来源：财新网 / 证券日报 | 2026-05-20/21

第四条：2026年AI推理算力年增122%——北美CSP开启GB/Rubin整柜采购潮

核心信息：

TrendForce 最新报告显示，2026 年北美五大 CSP（云服务商）的 AI 训练算力年增 56%+，推理算力年增约 122%。NVIDIA、AMD 及 CSP 自研 ASIC 三大平台同步放量，AI 推理正从「配角」跃升为算力增长主引擎。

性能/价格对比：

算力类型	2026年增长率	趋势判断
AI 训练算力	+56%	短期仍占出货 55%，中长期让位推理
AI 推理算力	+122%	增速是训练的两倍，成为主力
平台格局	NVIDIA/AMD/ASIC 三足鼎立	CSP 自研 ASIC 加速替代通用 GPU

对开发者/企业的影响：

推理算力增速首次大幅超越训练算力，意味着 AI 应用正从「炼模型」转向「用模型」阶段。中国电信宁夏公司已启动 164.51 亿元「Token 工厂」项目，国内算力基建同样在加速。对于应用层开发者，推理成本下降是重大利好。

信息来源：TrendForce 集邦咨询 / 格隆汇 | 2026-05-20

第五条：大模型 API 价格战白热化——从「军备竞赛」到「实用主义」集体转向

核心信息：

2026 年 5 月，API 价格差距达到历史极值：最便宜的 DeepSeek V4 Flash 仅

0.14/

0.28（输入/输出，每百万 Token），而旗舰 GPT-5.5 Pro 高达

30/

180，价差超过 200 倍。国产模型已将推理成本打到「一毛一」，GLM-4.7（华为昇腾版）更是低至 $0.11/百万 Token。

性能/价格对比：

梯队	代表模型	输入/输出价格（$/M token）	适用场景
旗舰	GPT-5.5 / Claude Opus 4.6	$5 /$ 25-30	复杂推理、高价值任务
中端	Gemini 3.1 Pro / DeepSeek V4 Pro	$0.43-$ 2 / $0.87-$ 12	日常编程、内容生成
经济	DeepSeek V4 Flash / MiMo-V2.5-Flash	$0.10-$ 0.14 / $0.28-$ 0.30	批量处理、高吞吐
专用	GPT-5.2-Codex	$1.75 /$ 14	代码生成、技术文档

对开发者/企业的影响：

豆包等国产模型开始从免费转向收费，标志着行业从「烧钱换规模」走向商业闭环。对开发者而言，「什么任务用什么模型」成为最佳实践——复杂推理用 GPT-5.5，日常任务用 DeepSeek V4 Flash，中小团队几千块能用一年。

信息来源：DevTk.AI / 搜狐科技 | 2026-05-22

本简报由英辰朗迪GEO整理，了解更多欢迎访问 https://www.aibridge.cn

技术博客

英辰朗迪AI动态简报之算力基建篇

第一条：Gemini 3.5 Flash 发布——谷歌打出「价格砍半、速度4倍」组合拳

第二条：英伟达Q1财报炸裂——营收816亿美元，数据中心收入752亿同比增92%

第三条：阿里云全栈升级——真武M890芯片 + Qwen3.7-Max + 千问云三箭齐发

第四条：2026年AI推理算力年增122%——北美CSP开启GB/Rubin整柜采购潮

第五条：大模型 API 价格战白热化——从「军备竞赛」到「实用主义」集体转向

更多新闻

英辰朗迪GEO：2026年还在「写完就不管」？AI已经把你标成僵尸信源了！

英辰朗迪GEO：AI算力基建动态简报（2026.07.19）

英辰朗迪GEO：AI技术前沿动态简报（2026.07.19）