第1条:OpenAI 首款自研 AI 芯片"Jalapeno"横空出世,联手博通九个月完成流片

核心信息

北京时间 2026 年 6 月 25 日,OpenAI 正式对外发布其首款自研 AI 推理芯片,命名为 Jalapeño(哈拉贝诺辣椒)。该芯片由 OpenAI 与半导体巨头博通(Broadcom)联合开发,专为大语言模型推理场景设计,从设计到流片仅用时九个月,创下行业纪录。

性能/价格对比

  • 定位:推理专用芯片,非训练芯片,主打高性价比推理部署

  • 合作模式:OpenAI 提供架构设计,博通负责物理实现与量产

  • 战略意义:OpenAI 从此摆脱对英伟达 GPU 的单一依赖,推理成本有望大幅下降

对开发者/企业的影响

OpenAI 自研芯片量产后,API 推理成本有望进一步降低,开发者的调用费用可能迎来新一轮下调;同时也标志着 AI 巨头向上游芯片环节延伸成为行业新趋势。

信息来源:Weste.net | 2026-06-25


第2条:英伟达 Blackwell Ultra 发布,FP8 算力高达 20 petaFLOPS

核心信息

2026 年 6 月 1 日,英伟达 CEO 黄仁勋在台北国际电脑展上揭晓新一代 AI 芯片 Blackwell Ultra,FP8 算力高达 20 petaFLOPS,较上一代 Blackwell 芯片实现显著性能跃升,AI 基础设施进入全新算力量级。

性能/价格对比

  • FP8 算力:20 petaFLOPS(Blackwell Ultra)vs 上代 Blackwell 约 10-14 petaFLOPS

  • 内存:搭载 HBM3e 最高 288GB,带宽超过 8 TB/s

  • 系统级:GB300 NVL72 机架方案可提供超过 1 ExaFLOP 的 FP4 推理算力

对开发者/企业的影响

Blackwell Ultra 的量产将大幅提升大模型训练与推理效率,单位算力成本持续下降;云服务商将在 2026 年下半年开始规模部署,开发者可期待更快的 API 响应速度和更低的延迟。

信息来源:Raybyte.cn | 2026-06-02


第3条:AI 大模型"超级 6 月":GPT-5.6、Claude Opus 4.8、Gemini 3.5 扎堆发布

核心信息

2026 年 6 月,全球 AI 大模型赛道迎来史无前例的密集发布潮。Anthropic 发布 Claude Fable 5(即 Claude Opus 4.8),谷歌推出 DiffusionGemma,月之暗面更新 Kimi K2.7 Code,智谱发布 GLM-5.2,微软更是一次性发布七款自研 MAI 系列模型(从 170 亿参数到 1.8 万亿参数 MoE 架构),标志着大模型竞争从"单点突破"进入"生态集群"较量阶段。

性能/价格对比

  • 微软 MAI-Orion:1.8 万亿参数 MoE 架构,直接对标 GPT-5 级别

  • 微软 MAI-Mini:170 亿参数,面向端侧部署,可在手机运行

  • Claude Opus 4.8:推理能力大幅提升,代码生成准确率创新高

  • 本月发布/更新的主流模型数量超过 10 款,创历史纪录

对开发者/企业的影响

模型选择空前丰富,开发者可根据场景选择性价比最优的模型;竞争加剧也将推动各大厂商 API 价格持续下行,企业 AI 应用落地成本将进一步降低。

信息来源:搜狐科技 / 掘金 | 2026-06-14


第4条:豆包大模型日均 tokens 调用量飙升至 180 万亿,一年增长超 10 倍

核心信息

在 2026 火山引擎 Force 原动力大会上,火山引擎总裁谭待透露:截至 2026 年 6 月,豆包大模型的日均 tokens 调用量已攀升至 180 万亿次。这一数字较模型发布初期实现了超过 1500 倍的爆发式增长,过去一年内也实现了超过 10 倍的显著提升,刷新国内大模型调用量纪录。

性能/价格对比

  • 日均 tokens 调用量:180 万亿(2026 年 6 月)vs 发布初期不足 0.12 万亿

  • 年增长率:超过 10 倍

  • 累计调用:已服务超过 30 万企业客户,覆盖营销、客服、代码等核心场景

对开发者/企业的影响

豆包大模型的大规模商用验证了其稳定性和性价比,企业可放心将核心业务构建在国产大模型之上;调用量激增也意味着火山引擎的算力基础设施投入持续加大,服务可用性将进一步提升。

信息来源:MSN 科技 / 火山引擎 | 2026-06-25


第5条:算力需求持续井喷,6 月以来国内算力合同签约金额已超 160 亿元

核心信息

进入 2026 年 6 月,国内算力服务市场迎来新一轮签约高潮。短短半个月内,多家上市公司披露百亿级、十亿级算力服务合同,涵盖算力租赁、项目总包、智慧运维等多个环节。行云科技子公司签署 5 年期算力服务协议,合同含税总金额达 10 亿元;预计 6 月全月签约金额将超过 160 亿元,算力服务市场高景气度持续攀升。

性能/价格对比

  • 6 月以来签约金额:已超 160 亿元人民币(半月数据)

  • 典型合同:行云科技 5 年期算力服务协议,含税 10 亿元

  • 市场预测:2026 年全年算力服务市场规模有望突破 2000 亿元

对开发者/企业的影响

算力供给持续扩张将缓解大模型训练和推理的算力瓶颈,中小企业获取优质算力的门槛和成本有望降低;同时也意味着 AI 应用落地的硬件基础更加坚实,更多创新应用将加速涌现。

信息来源:新浪财经 | 2026-06-17


本简报由 英辰朗迪GEO整理,了解更多欢迎访问 https://www.aibridge.cn