英辰朗迪AI动态简报之算力基建篇（2026.06.26）

第1条：OpenAI首款自研AI芯片Jalapeño发布，推理成本直降50%

核心信息：

OpenAI与博通（Broadcom）联合发布首款定制AI推理芯片"Jalapeño（哈拉贝诺辣椒）"，从项目启动到完成流片仅用时9个月，创下AI芯片研发速度纪录。该芯片专为大规模推理场景设计，相较此前依赖第三方GPU的方案，推理成本直接下降50%。

性能/价格对比：

研发周期：9个月完成流片（传统AI芯片研发周期通常18-24个月）
成本优势：推理成本较GPU方案降低50%
战略意义：OpenAI从纯模型公司转向全栈AI基础设施提供商

对开发者/企业的影响：

OpenAI自研芯片将逐步降低API调用成本，未来GPT系列API的价格有望进一步下探；同时标志着大模型厂商纵向整合趋势加速，第三方GPU需求可能在中长期面临结构性调整。

信息来源：新浪科技 | 2026-06-25

第2条：英伟达B200租赁价暴涨94%，算力供需失衡加剧

核心信息：

2026年6月，英伟达Blackwell架构主力推理GPU B200租赁价格迎来近乎翻倍式上调，涨幅高达94%。与此同时，全球批量采购交付周期已拉长至12-15个月，千片级新订单全部顺延至2027年第二季度交付，高端算力陷入结构性紧缺。

性能/价格对比：

B200租赁价格：较上季度上涨94%
交付周期：从6-8个月拉长至12-15个月
供需格局：千片级订单排至2027年Q2，AI企业运营成本显著推升

对开发者/企业的影响：

使用B200进行推理的AI应用成本将大幅上升，中小AI企业面临算力成本压力；建议提前锁定算力合约或评估国产GPU/NPU替代方案（如华为昇腾、寒武纪）。

信息来源：搜狐科技 | 2026-06-17

第3条：豆包大模型2.1发布，日均Token调用量突破180万亿

核心信息：

6月23日，火山引擎在2026夏季FORCE原动力大会发布豆包大模型2.1，同时推出视频、图像、音频等多款新模型，并升级面向Agent的云服务体系。截至2026年6月，豆包大模型日均Token调用量已突破180万亿，过去一年增长超10倍。

性能/价格对比：

日均Token调用量：180万亿（同比增长超10倍）
市场份额：火山引擎在中国公有云MaaS服务市场以49.5%份额位居第一
新能力：豆包2.1 Pro的Coding与Agent能力跨越"质变点"，生产级代码生成质量大幅提升

对开发者/企业的影响：

豆包2.1 Pro的Agent能力升级使复杂多步骤任务自动化成为可能，企业可基于豆包构建更高可靠性的AI工作流；低价Token策略持续，国内AI应用开发成本优势明显。

信息来源：新华网 | 2026-06-23

第4条：2026年全球AI服务器出货量预计达980万台，同比增长44%

核心信息：

据IDC与Gartner最新季度报告综合测算，2026年全球AI服务器出货量预计将达到980万台，较2025年的680万台同比增长44%。其中，用于大模型训练与推理的高端GPU/NPU服务器占比从2025年的37%跃升至55%，全球AI算力市场正从"单纯芯片性能竞赛"向"系统级算力效率博弈"深刻转型。

性能/价格对比：

全球AI服务器出货量：980万台（同比+44%）
高端GPU/NPU服务器占比：从37%跃升至55%
中国AI Token调用量：两年增长超千倍，算力需求持续爆发性增长

对开发者/企业的影响：

算力供给虽然快速增长，但需求增速更快，供需失衡短期难以缓解；企业需关注算力效率优化（推理量化、模型压缩），而非单纯依赖算力规模扩张。

信息来源：搜狐科技 / CSDN | 2026-06-01

第5条：华为盘古大模型2.0开源，国产AI算力生态加速完善

核心信息：

在2026年华为开发者大会（HDC 2026）上，华为常务董事、终端BG董事长余承东宣布盘古大模型2.0正式开源，标志着华为在人工智能领域的技术布局进入全新阶段。华为在算力资源紧张、技术路线调整等多重挑战下，坚持大模型研发战略定力，完成从底层算力到上层模型的全栈国产化替代。

性能/价格对比：

盘古2.0：全面开源，支持商用
算力底座：华为昇腾系列NPU，自主可控
战略定位：全球最早涉足大模型研发的企业之一，技术积累深厚

对开发者/企业的影响：

盘古2.0开源为国内企业提供了自主可控的大模型选择，特别适用于对数据安全和国产化有强需求的政企客户；结合华为云算力，可构建全栈国产化AI解决方案。

信息来源：IT熊仔 | 2026-06-01

本简报由英辰朗迪GEO整理，了解更多欢迎访问 https://www.aibridge.cn

技术博客

英辰朗迪AI动态简报之算力基建篇（2026.06.26）

第1条：OpenAI首款自研AI芯片Jalapeño发布，推理成本直降50%

第2条：英伟达B200租赁价暴涨94%，算力供需失衡加剧

第3条：豆包大模型2.1发布，日均Token调用量突破180万亿

第4条：2026年全球AI服务器出货量预计达980万台，同比增长44%

第5条：华为盘古大模型2.0开源，国产AI算力生态加速完善

更多新闻

英辰朗迪AI动态简报之商业洞察篇（2026.06.26）

英辰朗迪AI动态简报之算力基建篇（2026.06.26）

【英辰朗迪GEO新闻】2026年6月26日