第1条:英伟达发布NVIDIA Cosmos 3,全球首款完全开放全模态物理AI模型
核心内容:
英伟达在2026中国台北GTC大会上正式发布NVIDIA Cosmos 3,这是全球首款完全开放的全模态物理AI模型。该模型采用混合Transformer架构,打通视觉推理、世界生成、动作预测三大核心能力,面向物理AI场景提供开放世界基础模型能力。英伟达同步成立NVIDIA Cosmos Coalition全球协作联盟,集结全球顶尖世界模型研发团队与AI开发者,推动下一代开放世界模型的技术迭代与落地普及。
为什么重要:
物理AI是连接数字智能与物理世界的关键技术方向,Cosmos 3的完全开放策略降低了具身智能和机器人开发的门槛,有望加速物理AI在工业和消费场景的规模化落地。
信息来源:财联社 | 2026.06.04
第2条:MiniMax M3发布,国产开源大模型实现多模态超长上下文突破
核心内容:
稀宇科技正式推出新一代开源大模型MiniMax M3,支持百万级超长上下文处理,并首次在国内实现图片、视频输入与电脑桌面操作的原生多模态交互。该模型在SWE-Bench Pro编程基准测试中以59.0%的得分超越GPT-5.5与Gemini 3.1 Pro。技术架构上,研发团队采用稀疏注意力架构(MSA),将百万字场景下的单Token计算量缩减至前代模型的50%,理解阶段提速超9倍,答案生成效率提升15倍以上。
为什么重要:
MiniMax M3在编程能力和多模态理解上的突破,加上完全开源策略,为国内AI生态提供了具备国际竞争力的基础模型选择,尤其在长文档处理和复杂编程任务中具备实用价值。
信息来源:ITBear科技资讯 | 2026.06.01
第3条:2026年6月AI大模型密集发布,上下文窗口突破150万Token
核心内容:
2026年6月成为AI大模型史上最密集的发布月份。OpenAI发布GPT-5.6,上下文窗口扩展至150万Token;Anthropic发布Claude Sonnet 4.8,重点强化Agent能力;Google推出Gemini 3.5 Pro,采用推理时计算架构,推理准确率相比前代提升35%以上;马斯克xAI发布Grok 5。国产模型同步发力,通义千问Qwen3.6、智谱GLM-5.1、月之暗面Kimi K2.6相继发布,Kimi K2.6将上下文窗口进一步推至200万Token以上。
为什么重要:
上下文窗口的量级跃升使得全量财报分析、完整代码库理解、全年数据诊断等任务从理论走向实用,推理时计算架构的普及则显著提升了复杂任务的准确性,为企业AI应用的质量提供了关键保障。
信息来源:一道科技 | 2026.06.02
第4条:谷歌DeepMind开源DiffusionGemma,离散扩散技术重构文本生成范式
核心内容:
谷歌DeepMind开源实验性模型DiffusionGemma,采用离散扩散技术颠覆传统大模型逐字自回归生成范式。该模型支持单次并行生成256个Token文本块,最高实现4倍生成提速。模型采用26B总参数、3.8B激活参数的MoE架构,量化优化后仅需18GB显存即可完成本地部署。模型原生支持文本、图像、长视频多模态输入,内置逻辑推演思考模式,可通过全局自我纠错优化输出结果。
为什么重要:
DiffusionGemma打破了自回归生成的技术垄断,为本地低延迟、高实时性AI场景提供了新的技术路径,尤其适合单用户本地运行和实时人机交互场景,完善了云端加本地的全域AI模型生态。
信息来源:搜狐科技 | 2026.06.11
第5条:华为云发布CloudRobo,全球首个端到端具身智能开发平台
核心内容:
华为云在INSPIRE 2026大会上发布全球首个端到端具身智能开发平台CloudRobo,打通机器人研发全生命周期链路,涵盖数据喂养、模型训练、云端部署、系统集成全流程。平台构建数据与模型双重评估体系,过滤脏数据以保障机器人决策精准性;采用模块化动力控模型支持积木式快速拼装,降低具身智能开发门槛;实现云端接入缩短至小时级、模型部署压缩至分钟级。目前国家地方共建人形机器人创新中心、亿嘉和科技、上海交大等机构已完成平台落地验证。
为什么重要:
CloudRobo解决了具身智能从实验室原型到商业化落地的关键工程瓶颈,大幅降低机器人AI的开发门槛,预计将加速人形机器人和工业智能机器人在实体产业的渗透进程。
信息来源:搜狐科技 | 2026.06.11


