第一条:智源大会2026发布四大前沿模型——AI正式从「预测词元」进化到「预测物理状态」
核心内容:
6月12日,第八届北京智源大会在中关村国际创新中心开幕。智源研究院重磅发布四大模型:Emu3.5(纯自回归多模态统一基座,实现文本/图像/视频原生统一理解与生成)、Brainμ 1.0(全球首个多模态神经科学大模型,统一编码EEG/fMRI/MEG等全模态脑信号,万亿级数据平台)、OpenComplex 2.5(AI制药模型,「一模型四步骤」覆盖口袋识别→反向筛选→结构预测→亲和力预测全流程)、Physis-v0.1(全球首款通用世界基座模型,支持50+复杂物理场景长程推理)。智源明确提出AI演进路径:大语言模型→多模态大模型→世界模型。
为什么重要:
智源大会已成为中国AI学术旗舰。此次四大模型从脑科学、药物研发、物理世界三个方向齐头并进,标志着AI研究从「数字世界」正式迈向「物理世界」。Emu3.5继承Nature正刊发表的Emu3基因,Physis-v0.1更是直指工业、具身智能等真实场景,国产AI基础研究正在从跟跑进入领跑阶段。
信息来源:腾讯新闻/IPO早知道 | 2026.06.12
第二条:MiniMax MSA稀疏注意力炸场——109B模型1M上下文推理加速28倍,长文本Agent门槛被拉低一个数量级
核心内容:
MiniMax于6月13日发布论文 MiniMax Sparse Attention(MSA),提出基于GQA的块状稀疏注意力机制。在109B参数多模态模型上,1M上下文场景下每token注意力计算减少28.4倍,H800上实现14.2倍prefill加速和7.6倍decoding加速,推理内核与模型已全面开源。同一天,Kimi K2.7-Code也正式开源,1.1T参数MoE架构,Code Bench v2提升+21.8%,推理token消耗降低30%。
为什么重要:
长上下文推理效率一直是Agent落地的最核心瓶颈之一。MSA将百万token级推理成本降低一个数量级,意味着代码仓库级理解、全年财报分析等长文本Agent场景将从「可行但昂贵」变成「经济实用」。配合K2.7-Code的代码能力跃升,国产大模型在开源长上下文+代码双赛道正在形成合力。
信息来源:MiniMax论文(arxiv 2606.13392)/ Foxnan AI日报 | 2026.06.13
第三条:ALE「智能体最后的考试」揭榜——1500+道专家题最强模型通过率仅2.6%,智能体距离实用仍有鸿沟
核心内容:
6月13日,号称「智能体最后的考试」的ALE基准测试正式揭榜。该测试包含1500+道由真人专家命制的实操题目,覆盖量化交易、基因组分析、航空航天等55个行业子领域。排名第一的ALE自研Claw框架得分仅23.0%,Claude Code+Opus 4.7为22.7%,Fable 5+Claude Code为22.0%。最难的Last-Exam档所有模型平均通过率仅2.6%。更惊人的是成本差异:Fable 5完成任务花费2315美元,而GPT-5.5+Codex最贵仅566美元。同时Fable 5被曝安全分类器过度拒绝——免疫学家说「cancer」被判为生物安全风险。
为什么重要:
ALE首次用「真人专家出题+真实工业场景」替代传统编程基准,暴露出当前最强Agent在复杂长周期任务上的真实水平——不是AGI近了,而是比想象中远得多。同时Fable 5的天价成本和过度安全分类器之争,将「能力vs成本vs安全」这个不可能三角推到了台前。
信息来源:ALE榜单/ TXTMIX AI早报 | 2026.06.13
第四条:豆包「任务模式」+ Cursor Auto-review——Agent生态呈现「全链路执行」与「安全护栏」双线演进
核心内容:
6月13日,字节跳动豆包正式上线「任务模式」,支持定时执行、零代码网页生成、一键PPT、数据可视化等全链路Agent执行,原思考模式升级为「专家模式」调用豆包大模型2.0 Pro,模式切换变为「快速/专家/任务」三档,专业版售价最高500元/月。同一天,Cursor发布Auto-review机制:通过专用小模型分类器在工具调用前审查动作风险,高风险(如读密钥、操作生产数据)自动拦截,低风险放行,为AI Agent安全边界提供了可调节的「刻度盘」。
为什么重要:
两条新闻指向Agent生态的两个关键方向:豆包代表「Agent能力最大化」——让AI从聊天变成执行,打通从想法到交付的全流程;Cursor代表「Agent安全可控」——在生产环境中让Agent既有能力又不会"乱来"。两者共同表明:2026年6月,Agent正从实验室概念走向产品化落地,而「能力」与「安全」的平衡将是这个阶段的核心命题。
信息来源:IT之家/ Cursor Blog/ TXTMIX AI早报 | 2026.06.13
第五条:6月AI大模型「超级发布月」全景——150万Token上下文、推理时计算标配、Agent能力生产化三浪叠加
核心内容:
6月被产业界称为AI大模型「超级发布月」。海外四巨头并进:OpenAI GPT-5.6最早本月发布,上下文窗口突破150万Token(可一次性输入《三体》三部曲),首次展示实时多模态推理;Anthropic Claude Sonnet 4.8重点强化Agent能力与安全护栏;Google Gemini 3.5 Pro主打推理时计算架构,准确率比前代提升35%以上;xAI Grok 5深度集成X平台数据。国产阵营同样密集:阿里Qwen3.6多尺寸全开源、智谱GLM-5.1工程化部署优化、月之暗面Kimi K2.6上下文突破200万Token。
为什么重要:
三个趋势正在同时发生:上下文从128K跃至150-200万Token(不到两年扩大超10倍)、推理时计算从可选变标配(预测年底60%企业应用采用)、Agent能力进入生产环境。这意味着AI的「输入带宽」和「思考深度」正在同时爆发,企业部署AI的门槛和天花板都在被重新定义。
信息来源:一道科技/ 极客日志/ OX栈 | 2026.06.02-14
本简报由 英辰朗迪GEO整理,了解更多欢迎访问 https://www.aibridge.cn


