第1条:豆包大模型2.1 Pro发布,日均Tokens使用量突破180万亿
核心信息:
6月23日,火山引擎在「2026火山引擎FORCE原动力大会」上发布豆包大模型2.1 Pro,在代码生成、智能Agent、多模态处理三大核心能力上完成强化。豆包大模型日均Tokens使用量现已突破180万亿,相较2024年5月1200亿的初始规模,两年间涨幅达1500倍。现场演示中,依托该模型可支持500余个智能Agent同步协作,完成上千轮工具调用,生成超百栋建筑。
性能/价格对比:
Tokens调用量:180万亿/日 vs 1200亿/日(2024年5月),两年增长1500倍
Agent协同规模:500+智能Agent同步协作,上千轮工具调用
调用量意义:日均180万亿Tokens已接近全球头部大模型调用规模
对开发者/企业的影响:
豆包大模型已成为国内调用量最大的大模型之一,规模效应将持续推动企业接入成本下降,开发者可基于豆包2.1 Pro构建更复杂的多Agent协作应用,降低自部署算力的资本开支。
信息来源:每日经济新闻 | 2026.06.23
第2条:2026全球AI算力报告:服务器出货量980万台,高端GPU占比跃升至55%
核心信息:
据IDC与Gartner最新季度报告综合测算,2026年全球AI服务器出货量预计将达到980万台,较2025年的680万台同比增长44%。其中,用于大模型训练与推理的高端GPU/NPU服务器占比从2025年的37%跃升至55%,标志着算力需求已从少数科技巨头快速蔓延至千行百业。2026年全球AI训练芯片总产能约450万片/年(等效H100),实际需求约360万片/年,供需缺口从2024年的严重短缺收窄至基本平衡。
性能/价格对比:
AI服务器出货量:980万台(2026E)vs 680万台(2025),同比增长44%
高端GPU/NPU服务器占比:55%(2026E)vs 37%(2025),提升18个百分点
H800八卡服务器月租:21.2万元(6月初)vs 18.5万元(4月),涨幅14.6%
三巨头(谷歌/微软/亚马逊)年度资本开支合计:超2200亿美元
对开发者/企业的影响:
算力供给持续增加但高端GPU仍阶段性紧缺,租赁成本短期波动。建议在算力价格低位时锁定长期合约,或评估国产算力替代方案以降低成本。阿里云已推出「算力期货」服务,可提前锁定未来3-6个月GPU租赁价格。
信息来源:IDC/Gartner/云熵数据 | 2026.06
第3条:华为昇腾920 + CANN 8.0发布,国产算力生态实现关键突破
核心信息:
2026年6月,华为正式发布昇腾920系列AI芯片及CANN 8.0软件栈。昇腾920采用达芬奇架构3.0,集成更多张量核心和稀疏计算单元,BF16精度下理论算力达1800 TFLOPS,较上一代910B提升约80%。CANN 8.0首次实现对PyTorch 3.0的「原生级」支持,无需用户手动修改代码即可无缝迁移大部分标准模型,大幅降低了从英伟达CUDA生态迁移的切换成本。
性能/价格对比:
算力:1800 TFLOPS(BF16)vs 910B约1000 TFLOPS,提升80%
功耗:单卡TDP 750W vs 英伟达B200的700W,高出约7%
推理性能:ResNet-50与A100相当;Llama-3-70B落后约12%-15%
国产AI芯片市占率:训练场景18%(2026E)vs 12%(2025);推理场景有望突破30%
液冷服务器渗透率:45%(2026新建数据中心)vs 25%(2025)
对开发者/企业的影响:
PyTorch 3.0原生支持是国产算力生态的里程碑式突破,国内AI企业可更低成本地评估国产算力方案。昇腾920在推理场景已具备较强竞争力,金融、运营商、安防等信创领域企业建议优先评估采用。
信息来源:华为官方/中国半导体行业协会 | 2026.06
第4条:AMD MI400X量产3倍增长,微软Maia 3性能超越B200显存带宽
核心信息:
2026年Q2,全球AI芯片供给格局出现显著变化。AMD MI400X正式进入量产爬坡阶段,Q2出货量预计达15万片,是去年同期MI350X的3倍,迅速填补英伟达留下的部分产能缺口。与此同时,微软Azure在6月初宣布,其新一代「Maia 3」AI加速芯片将在2026年Q3进行内部大规模部署,该芯片采用Chiplet架构,单卡功耗600W,通过HBM4内存实现2.3TB/s的显存带宽,这一指标超过了英伟达B200的1.8TB/s。
性能/价格对比:
AMD MI400X出货量:15万片(2026Q2E)vs MI350X同期约5万片,增长3倍
英伟达B200 Ultra交付率:68%(2026Q2实际 vs 预期),受CoWoS-L良率影响
微软Maia 3显存带宽:2.3TB/s vs 英伟达B200的1.8TB/s,高出约28%
微软Maia 3功耗:600W vs B200的700W,低约14%
HBM4成本:较HBM3e高出约40%,良率仅60%-65%
对开发者/企业的影响:
英伟达高端GPU供给持续紧张,AMD MI400X及各家自研芯片正快速填补市场缺口。微软Maia 3在显存带宽和功耗控制上已超越B200,企业在规划算力采购时,可评估AMD GPU及云厂商自研芯片方案,以分散供应链风险并降低TCO(总拥有成本)。
信息来源:行业调研/微软官方 | 2026.06
第5条:科创板第五套标准扩围至AI大模型领域,优质企业上市通道正式打开
核心信息:
6月17日,在2026陆家嘴论坛开幕式上,证监会主席吴清宣布,科创板第五套上市标准适用范围扩大至人工智能领域,积极支持优质人工智能大模型企业上市。上交所同日正式发布《上海证券交易所发行上市审核规则适用指引第10号》,明确发行人需满足「至少有一个大模型产品已完成上线发布并实现规模化应用」等四方面具体要求,支持通用大模型和行业专用模型同步适用。
性能/价格对比:
(政策类新闻,无直接性能/价格数据)
适用条件:①明显技术优势 ②阶段性成果(大模型已上线并规模化应用) ③取得国家有关部门批准 ④市场空间大
支持范围:通用大模型 + 行业专用模型
规模化应用认定标准:用户或部署设备数量、模型调用量、AI主流社区下载量排名、业务场景落地情况等
对开发者/企业的影响:
AI大模型企业融资渠道显著拓宽,已进入规模化应用阶段的优质企业可借助资本市场加速技术迭代和算力投入。对算力产业链而言,更多AI企业上市将带动GPU/AI芯片采购需求进一步增长,长期利好算力基建板块。
信息来源:光明网/经济参考报 | 2026.06.18
本简报由 英辰朗迪GEO整理,了解更多欢迎访问 https://www.aibridge.cn


