2026年6月
3版完整
有内容
暂无
早间版 · 08:00 · 实时

今日 AI 脉搏

2026年6月14日 · 星期日

18
头条新闻
12
信源覆盖
5
热门项目
1
精选论文
TL;DR 本周MiniMax M3与华为openPangu 2.0相继发布,国产大模型进入百万上下文时代;小米开源AI编程助手MiMo Code,多项基准超Claude Code;微信开放AI Agent生态,14亿用户一句话即可叫车点外卖;中央网信办启动「清朗·整治AI应用乱象」专项行动,已备案大模型达868款。
HEADLINE
MiniMax M3 发布:百万上下文 + 原生多模态,编程超 GPT-5.5
6月1日,MiniMax 正式发布新一代通用模型 M3,采用自研稀疏注意力架构 MSA,支持 100 万 token 超长上下文。模型集前沿编程能力、1M 超长上下文、原生多模态于一体,在 SWE-Bench Pro 评测中超越 GPT-5.5 和 Gemini 3.1 Pro。M3 是全球唯一具备完整能力组合的开源模型,已上传 HuggingFace 和 GitHub。定价方面,Plus 版 49 元/月(6 亿 token),Max 版 119 元/月,Ultra 版 469 元/月。
钛媒体·13天前·多源报道
💡 开发者影响:开源 1M 上下文模型,可用个人硬件微调部署
重磅发布 · HDC 2026
华为 openPangu 2.0 发布:512K 上下文,昇腾单卡推理 2 倍性能
余承东在华为开发者大会宣布 openPangu 2.0 开源大模型,分为 Pro(505B/18B 激活)和 Flash(92B/6B 激活)两个版本。512K 上下文窗口,鸿蒙智能体深度适配,昇腾算力深度调优。6月30日起分批开源7大核心组件。余承东喊话:"字典里没有第二,只有第一!"
东方财富 · 2天前
💡 开发者影响:昇腾生态开源模型,国产推理部署首选
突破架构
Google 发布 DiffusionGemma:扩散架构生成快 4 倍,消费级显卡可跑
谷歌推出实验性开源模型 DiffusionGemma,采用文本扩散架构替代传统自回归。26B MoE 参数但推理仅激活 3.8B,量化后在 18GB 显存消费级显卡上即可运行。支持双向注意力与并行生成,适用于行内编辑、代码补全等实时交互场景。已通过 Apache 2.0 许可证在 HuggingFace 开源。
PingWest · 3天前
💡 开发者影响:扩散架构新范式,本地推理部署门槛降低
前沿追踪
OpenAI 剑指 GPT-5.6:150 万上下文,秘密提交 IPO 申请
GPT-5.6 内部代号 "iris-alpha",已在 OpenAI Codex 后台日志中发现踪迹,上下文长度可能达到 150 万 tokens。市场预测 6 月底前发布概率超过 70%。与此同时,OpenAI 已于 6 月 8 日向 SEC 秘密提交 IPO 申请,Sam Altman 预计 "明年内" 上市。2026 年预计亏损约 140 亿美元。
C114 · 近日
💡 开发者影响:150 万上下文将重新定义 Agent 应用边界
生态动态
DeepSeek 完成 500 亿融资,V4 系列定价仅为国际同类 2%
DeepSeek 首轮融资约 500 亿元人民币,投后估值最高达 4000 亿元。创始人梁文锋个人出资 200 亿元,腾讯拟投 100 亿,宁德时代拟投 50 亿。DeepSeek-V4 系列已全面支持百万上下文,定价仅为国际同类产品约 2%,并主动退还缓存计费偏差赠金。市场预计 V4.1 版本将在 6 月推出。
证券时报 · 近日
💡 开发者影响:极致性价比模型 API,适合高频大批量调用
💻
小米 MiMo Code
开源终端 AI 编程助手,基于 OpenCode 二次开发,MIT 协议。内置持久记忆系统与 Compose 模式,覆盖设计→规划→编码→测试→审查全流程。在 SWE-Bench Pro V2 和 Terminal Bench 2 上均超 Claude Code 约 5 个百分点。
开源 MIT
vLLM v0.22.1
最新版修复多节点 Ray 数据并行挂起问题,新增 AMD Zen CPU 量化推理与 JetBrains Mellum v2 支持。CUDA_VISIBLE_DEVICES 重构为 --device-ids 参数,修复 DeepSeek-V4 初始化问题。
更新
🏆
Xcode 27 Beta
苹果在 Xcode 27 Beta 中原生集成 Google Gemini,使其成为继 OpenAI Codex 和 Claude Agent 之后第三个内置 AI 编程智能体。开发者无需切换工具即可完成多步骤开发任务。
新集成
部署实战
K8s 成为 AI/ML 默认生产平台,GPU 利用率可提至 85%
KubeCon 2026 确认 Kubernetes 已成为 AI/ML 工作负载的默认生产平台。vLLM 成为 LLM 推理事实标准引擎,KServe 从 CNCF 毕业。通过多租户调度,GPU 利用率可从行业基线 25%-35% 提升至 60%-85%。
💡 开发者影响:K8s + vLLM 成标准部署栈,建议尽早熟悉
监管升级
中央网信办启动「清朗·整治AI应用乱象」专项行动,已备案模型达868款
中央网信办部署为期 4 个月的专项行动,重点整治"应备未备"、语料安全、数据投毒、生成内容标识不到位等 7 类问题。截至 2026 年 4 月 30 日,全国已完成 868 款大模型备案、530 款应用登记。同时开设涉 AI 应用乱象举报专区(12377),受理 14 类违规问题。举报渠道包括网站 www.12377.cn、微信公众号"全国网络举报"等。
新华网 · 6月12日
💡 开发者影响:上线前务必完成备案登记,合规成本上升
数据制度
国家数据局推进 AI 数据制度建设:三权分置 + 合成数据研究
国家数据局召开"完善数据相关规则 赋能人工智能创新发展"座谈会,DeepSeek、字节跳动、阿里云、腾讯等参与。随后印发实施方案,提出落实数据持有权、使用权、经营权三权分置,研究合成数据等新议题,推动版权作品数据有序用于模型训练。证监会亦发布新指引,要求资本优先配置 AI 与先进制造领域。
国家数据局 · 6月8日
💡 开发者影响:数据合规使用将成为模型训练前置条件
📚 本周精选 · ICML 2026
FLARE: Diffusion for Hybrid Language Model — 自回归与扩散统一框架
发表于 arXiv(2606.01774),提出首个自回归+扩散统一训练框架,单个 checkpoint 同时支持 AR 验证式解码和扩散式并行去噪。实验表明,迁移数据质量是能力保留的关键因素,而非损失函数或注意力掩码设计。这为 LLM 推理阶段提供了灵活的"速度-质量"权衡选择。
arXiv:2606.01774 · 6月1日 · 被引趋势:上升中
💡 开发者影响:统一 AR/扩散架构或将改变推理部署策略选择
🚀 生态级落地
微信开放 AI Agent 生态:一句话叫车点外卖不跳转
微信向 14.32 亿月活用户开放 AI Agent 能力,首批接入美团、滴滴、京东、携程等。用户一句话即可完成叫车、点外卖、订酒店等操作,全程不跳转。提供自动/开发两种接入模式,目前内测中。这标志着腾讯系、阿里系、字节系形成 AI 消费入口"三国杀"格局。
北京商报 · 6月9日
💡 开发者影响:微信 AI 生态催生大量小程序 Agent 开发机会
🏭 产业级落地
找钢网 AI 智能体:交易效率提升 10 倍,日均处理千万条消息
找钢网 AI 智能体实现"沟通即交易,对话即下单",获央视《朝闻天下》专题报道。日均处理超 1000 万条交易消息,解析准确率超 95%。2025 年 AI 业务收入 3.35 亿元,同比增长 217.5%。与腾讯云 ADP 平台深度合作,推出"找钢 Claw"智能助手。
北京日报 · 6月11日
💡 开发者影响:产业 AI Agent 从问答走向交易闭环,ROI 可量化
📈 GitHub Trending — AI 领域 Top 5
1headroom+13K stars/周
2hermes-agent+11.5K stars/周
3turbovec+1.6K stars/日
4odysseus+1K stars/日
5Agent-Reach+796 stars/日
📈 趋势解读

上下文压缩 headroom 可节省 60-95% Token 成本,反映 Agent 工作流对 Token 优化的刚需。

记忆增强 Agent hermes-agent 190K 总星数,记忆功能成为 Agent 标配。

自托管 AI odysseus 引领私有本地部署趋势。

中文平台集成 Agent-Reach 支持 B 站、小红书,打破英文工具垄断。

💡 Rust + Python 模式在高性能 AI 基础设施中持续流行

🌏 国际合作
Sam Altman 今日访韩,会晤三星、Naver 探讨 AI 合作
OpenAI CEO 奥尔特曼于 6 月 14 日访问韩国,计划会见三星电子、Naver、Kakao 等企业高管。议程包括三星 DX 部门 AI 转型、KakaoTalk 集成 ChatGPT、Naver 云合作,以及探讨 5000 亿美元 "Stargate" AI 数据中心项目的存储芯片供应。此前三星已宣布向全体员工开放 ChatGPT、Gemini、Claude 三种外部 AI。
💡 开发者影响:多模型企业策略成为趋势,单一平台绑定减弱
💬 社区热议
Hacker News 热议:AI 泡沫是否破裂?"AI Slop"指控成社交门槛工具
Hacker News 六月初热议 AI 泡沫。研究发现 "AI slop" 指控在 Reddit 和 HN 上增长 10 倍以上,94% 的负面 AI 指控使用该标签,现更多被用于社交身份标记而非真实检测。同时引发讨论的还有 AI 编程工具引入安全漏洞、Claude Code 源码泄露、UC Berkeley CS 挂科率飙升与 AI 依赖的关联等。
💡 开发者影响:AI 工具实用主义回归,过度炒作正在退潮
🏛️ 政策动向
亚马逊 CEO 与特朗普政府就 AI 大模型通话,行业监管博弈升温
亚马逊 CEO 安迪·贾西与其他科技企业负责人与特朗普政府就 AI 大模型进行通话,讨论产业政策与监管方向。与此同时,Alphabet 提议 800 亿美元股权融资用于 AI 基础设施建设,S&P 500 拒绝将 OpenAI、Anthropic 等 AI 公司快速纳入指数,市场对 AI 投资回报的审慎情绪上升。
💡 开发者影响:海外 AI 政策不确定性增加,关注出口管制变化