第1条:NVIDIA发布RTX Spark超级芯片,PC 40年来首次被重新定义
核心信息:
Computex 2026期间,黄仁勋在GTC Taipei发布RTX Spark智能体计算平台——这是与联发科联合研发的PC级超级芯片,台积电3nm制程、700亿晶体管。GPU端基于Blackwell架构配备6144个CUDA核心和第五代Tensor Core,AI峰值算力高达1 PetaFLOP(1000 TFLOPS);CPU端为联发科定制的20核Grace处理器,通过第二代NVLink-C2C实现高速互联,最高配备128GB统一内存。华硕、戴尔、惠普、联想、微软Surface和微星将在2026年秋季首批推出搭载产品,覆盖笔记本、台式机和DGX Station(768GB内存,可本地运行万亿参数模型)三种形态。
性能/参数对比:
维度 | RTX Spark | 传统PC芯片 |
AI算力 | 1 PetaFLOP | TFLOPS级 |
CPU核心 | 20核 Grace(Arm) | x86架构 |
制程 | 台积电3nm / 700亿晶体管 | — |
统一内存 | 最高128GB | 分立式 |
CUDA核心 | 6144 | — |
互联技术 | NVLink-C2C第2代 | PCIe |
对开发者/企业的影响:
黄仁勋称这是"PC诞生40年来首次被重新定义"——从传统的CPU+GPU分立架构,转向CPU+GPU+NPU统一计算平台。1 PFLOP的本地AI算力意味着开发者在笔记本上即可运行200B+参数模型,Agent应用的端侧部署门槛被大幅拉低。
信息来源:IT之家 / 澎湃新闻 / 新浪财经 | 2026年6月1日~4日(Computex 2026)
第2条:MiniMax发布开源M3模型,编程能力超越GPT-5.5,单token计算量降至1/20
核心信息:
6月1日,国产大模型公司MiniMax发布新一代通用模型MiniMax M3,采用自研MiniMax Sparse Attention(MSA)稀疏注意力架构。M3支持100万Token超长上下文,是全球唯一同时具备"前沿编程能力+1M长上下文+原生多模态"三项核心能力的开源模型。在SWE-Bench Pro编程评测中,M3得分超越GPT-5.5和Gemini 3.1 Pro,逼近Opus 4.7;在SVG-Bench代码生成评测中甚至超越Opus 4.7。多模态方面,OmniDocBench得分同样超越Gemini 3.1 Pro。Agent评测(Claw-Eval)得分最高。
性能/效率对比:
评测维度 | MiniMax M3 | 对比结果 |
SWE-Bench Pro(编程) | 超越GPT-5.5 / Gemini 3.1 Pro | 接近Opus 4.7 |
SVG-Bench(代码生成) | 超越Opus 4.7 | 最优 |
OmniDocBench(多模态) | 超越Gemini 3.1 Pro | 领先 |
Claw-Eval(Agent) | 最高分 | 第一 |
长上下文效率 | 单token计算量降至1/20 | MS稀疏注意力 |
定价 | Plus版49元/月(6亿token) | 订阅制 |
对开发者/企业的影响:
MSA架构在100万上下文下将单token计算量压缩至上一代模型的1/20,长文档和代码仓库处理的性价比大幅提升。开源策略使中小企业可私有化部署对标GPT-5.5级别的编程模型,配合Token Plan订阅定价,编程Agent的规模化部署成本急剧下降。
信息来源:网易科技 | 2026年6月1日
第3条:2026全球AI算力报告发布:2030年算力中心总容量达220GW,AI负载占71%
核心信息:
6月初,2026全球AI算力发展研究报告正式发布,揭示十大产业趋势。核心数据:2026年全球算力中心总容量102GW,AI负载62GW;预计2030年总容量飙升至220GW(AI占比71%,达156GW)。全球算力中心电力消耗将从2024年的415TWh增至2030年的945TWh(年均增速15%),成为全球电力需求增长最快的领域。AI工厂造价从最初的200-300亿美元攀升至500-600亿美元,很快将达800-1000亿美元,到本十年末全球将有100吉瓦AI工厂上线。
十大趋势速览:
序号 | 趋势方向 | 核心要点 |
1 | Scale Up + Scale Out | 纵横向双维驱动,超节点从千卡→数十万卡 |
2 | 中国集群突破 | 华为昇腾+昆仑芯+摩尔线程+沐曦矩阵,韬定律 |
3 | 推理算力激增 | 多智能体系统Token消耗达传统对话5-8倍 |
4 | 能源多元化 | 风光储→核能→氢能三阶段路线 |
5 | 太空算力 | Starcloud-1卫星已发射,轨道部署探索起步 |
6 | 词元经济学 | TTFT和Token吞吐量成核心效率指标 |
7 | 异构计算升级 | GPU+LPU+CPU+DPU四维异构架构 |
8 | 集群功耗跃升 | 从千瓦级→吉瓦级,华为昇腾384超节点 |
9 | 电力需求爆发 | 中国2030年AIDC容量近60GW,AI占48% |
10 | 算网融合 | 纳入十五五规划109项重大工程 |
对开发者/企业的影响:
算力基础设施正从IT配角升级为国家战略级公共基础设施。黄仁勋提出"算力即营收,每瓦Token数即利润率"——效率指标将取代纯算力规模成为产业核心竞争维度。
信息来源:CSDN / 智东西 | 2026年6月1日
第4条:国产AI芯片集体冲击资本市场,昆仑芯、燧原、中星微、平头哥排队上市
核心信息:
2025年末至2026年初,国产AI芯片迎来集中上市潮。摩尔线程(2025.12.5科创板,首日涨超400%)、沐曦股份(2025.12.17科创板,募资39亿,曦云C700对标H100)、壁仞科技(2026.1.2港交所,1200+公开专利)三家已率先上市。排队中的包括:昆仑芯(港股+科创板双轨,估值210亿)、燧原科技(科创板IPO已受理,拟募资60亿)、中星微技术(启动科创板辅导,估值200亿+)、平头哥(拟独立上市,估值传闻250-620亿美元,累计交付47万片)。2025年中国AI芯片出货401.6万张,本土厂商占41%。
上市格局一览:
公司 | 上市地/进展 | 估值/募资 | 核心看点 |
摩尔线程 | 科创板 2025.12 | 首日涨400%+ | 国产GPU第一股 |
沐曦股份 | 科创板 2025.12 | 募资39亿 | 曦云C700对标H100 |
壁仞科技 | 港交所 2026.1 | — | 港股GPU第一股 |
昆仑芯 | 港股+科创板 | 估值210亿 | 百度旗下,M100/M300 |
燧原科技 | 科创板受理 | 拟募60亿 | DSA专用架构 |
中星微 | 科创板辅导 | 估值200亿+ | XPU异构,星光五号 |
平头哥 | 拟独立上市 | 250-620亿美元 | 阿里旗下,交付47万片 |
对开发者/企业的影响:
国产AI芯片从"造得出"到"买得到"(上市募资扩产),再到"用得起"(竞争驱动降价),产业正进入正向循环。昆仑芯210亿估值、平头哥最高620亿美元的传闻估值,显示资本市场对国产算力赛道的定价正接近全球头部水平。
信息来源:搜狐科技 | 2026年5月
第5条:小米MiMo-V2.5降价99%加入价格战,不再区分上下文长度
核心信息:
5月27日,小米集团宣布自研大模型MiMo-V2.5系列API永久降价,最高降幅达99%。此次降价最显著的规则变化是取消区分上下文窗口长度的传统定价方式——此前不同上下文长度(8K/32K/128K等)对应不同价格,现在统一定价。这也是继DeepSeek 5月22日宣布V4-Pro永久降价至原价四分之一之后,又一家重量级厂商加入大模型API价格战。雷军同日宣布,未来三年将砸600亿元投入AI领域。
价格变化对比:
维度 | 调整前 | 调整后 |
最高降价幅度 | — | ↓99% |
上下文区分 | 8K/32K/128K分别定价 | 统一价格 |
全球范围 | — | 全球同步调整 |
生效时间 | — | 2026.5.27 00:00 |
对开发者/企业的影响:
取消上下文长度区分的定价策略是行业首创——此前长上下文一直是高溢价区,此次变革意味着开发者不再需要为"用更长的上下文"额外付费,长文档和复杂代码分析类应用的成本直接降至原来的1%。结合DeepSeek、腾讯云等厂商的集体降价,国内大模型API正从"按Token计费"快速走向"近乎免费的基础设施"阶段。
信息来源:财新网 / 腾讯新闻 / 36氪 | 2026年5月27日
本简报由 英辰朗迪GEO整理,了解更多欢迎访问 https://www.aibridge.cn


