第1条:Kimi K3大模型确认7月发布,参数规模达2.5万亿
核心信息:
月之暗面旗下Kimi公司员工Young_AGI在X平台确认,新一代大模型Kimi K3将于7月内发布。据内部消息,K3参数规模预计达到2.5万亿,超越DeepSeek V4 Pro的1.6万亿和百度文心5.0的2.4万亿,成为国产大模型中参数规模最高的产品。K3将支持1M上下文及多模态能力。
性能/价格对比:
参数规模:K3(2.5万亿)> 文心5.0(2.4万亿)> DeepSeek V4 Pro(1.6万亿)
上下文长度:支持1M tokens
多模态支持:是
对开发者/企业的影响:
K3发布后,国产大模型参数竞赛进入2.5万亿级别,开发者可期待更强的多模态理解和长文本处理能力。但参数规模提升也意味着推理成本可能相应增加,需在模型选择时权衡性能与成本。
信息来源:快科技 | 2026.07.01
第2条:Meta筹划对外出售算力,AI云计算市场迎来新玩家
核心信息:
7月1日,Meta宣布正在筹建云计算业务,计划对外出售或出租闲置AI算力。具体模式包括两类:一是将部署在自身AI基础设施上的模型能力开放给外部客户,二是出租更底层的"裸算力"。据机构测算,到2028年,Meta算力业务年化收入有望达2640亿美元。消息发布后,Meta单日市值暴涨1270亿美元,而CoreWeave、美光、SK海力士等AI硬件股集体大跌。
性能/价格对比:
Meta算力业务预计年化收入:2640亿美元(2028年)
Meta单日市值增长:1270亿美元
市场反应:CoreWeave、美光、SK海力士等大跌
对开发者/企业的影响:
Meta入局算力租赁市场,可能为市场带来新的算力供给选择,长期来看有助于缓解算力短缺问题。但短期市场担忧算力过剩,导致AI硬件板块波动。开发者可关注Meta算力租赁服务的定价策略,作为现有云服务商的替代选项。
信息来源:MSN中文版 | 2026.07.01
第3条:金山云加速GPU算力建设,小米百亿预算落地、阿里签5年长约
核心信息:
7月2日,界面新闻独家获悉,金山云下半年将加速GPU算力集群建设。小米对金山云的GPU算力需求已从万卡集群升级为超大规模算力集群,投入预算由近40亿元增至百亿元以上。阿里大模型团队与金山云签署5年期算力租赁合同,涉及3000余台八卡GPU服务器,全部交付后月流水约3亿元,年化收入超过40亿元。金山云2026年资本开支计划上调至150亿元。
性能/价格对比:
小米投入预算:近40亿元 → 100亿元以上
阿里合同规模:3000余台八卡GPU服务器,年化收入超40亿元
金山云2026年资本开支:150亿元
算力价格涨幅:行业平均上涨50%-70%
对开发者/企业的影响:
头部云计算厂商加速算力基础设施建设,有助于缓解国内算力短缺问题。但算力价格平均上涨50%-70%,企业AI训练和推理成本短期承压。长期合约模式(3-5年)成为主流,企业需提前规划算力需求,锁定价格和供给。
信息来源:新浪财经(界面新闻) | 2026.07.02
第4条:AMD上调GPU显存套料价格10%,显卡终端售价承压
核心信息:
根据供应链最新消息,AMD已向蓝宝石、华硕、XFX讯景、瀚铠等主要显卡合作伙伴发出正式通知,自2026年7月起,将上调GPU核心与GDDR显存配套套料的供货价格,整体涨幅约为10%。本次调价主要源于全球GDDR显存颗粒供应紧张,叠加AI算力需求持续旺盛,显存成本大幅上升。
性能/价格对比:
AMD GPU套料价格上涨:10%(自2026年7月起)
涨价范围:GPU核心 + GDDR显存配套套料
影响品牌:蓝宝石、华硕、XFX讯景、瀚铠等
对开发者/企业的影响:
AMD GPU价格上涨将传导至终端显卡产品,企业采购GPU服务器成本进一步上升。对于依赖AMD GPU进行AI训练或推理的企业,需重新评估采购计划和成本预算。显存供应紧张状态预计将持续,建议企业提前锁定供货合同。
信息来源:中关村在线 | 2026.07.01
第5条:AI芯片初创Etched累计融资8亿美元,Transformer专用芯片Sohu即将交付
核心信息:
6月30日,AI芯片初创公司Etched对外公布融资进展、产品细节及客户合同等关键信息。该公司由三位哈佛大学辍学生于2022年在加州创立,累计融资8亿美元,投后估值约50亿美元,已签署超过10亿美元的预售合同。其首款产品Sohu芯片为Transformer专用ASIC芯片,针对大语言模型推理进行优化,性能有望大幅超越通用GPU。
性能/价格对比:
累计融资:8亿美元
投后估值:50亿美元
预售合同:超过10亿美元
产品定位:Transformer专用ASIC芯片,优化大语言模型推理
对开发者/企业的影响:
专用AI推理芯片的成熟,为市场提供了GPU之外的算力选择。Sohu芯片针对Transformer架构优化,推理性能有望超越通用GPU,且成本可能更低。开发者可关注该芯片的实际性能表现和可用性,作为推理算力的替代方案。但专用芯片的生态兼容性需进一步验证。


