AI 脉搏 · 热点速览

大模型动态 Models

HEADLINE

MiniMax M3 发布：百万上下文 + 原生多模态，编程超 GPT-5.5

6月1日，MiniMax 正式发布新一代通用模型 M3，采用自研稀疏注意力架构 MSA，支持 100 万 token 超长上下文。模型集前沿编程能力、1M 超长上下文、原生多模态于一体，在 SWE-Bench Pro 评测中超越 GPT-5.5 和 Gemini 3.1 Pro。M3 是全球唯一具备完整能力组合的开源模型，已上传 HuggingFace 和 GitHub。定价方面，Plus 版 49 元/月（6 亿 token），Max 版 119 元/月，Ultra 版 469 元/月。

钛媒体·13天前·多源报道

💡 开发者影响：开源 1M 上下文模型，可用个人硬件微调部署

⚡

重磅发布 · HDC 2026

华为 openPangu 2.0 发布：512K 上下文，昇腾单卡推理 2 倍性能

余承东在华为开发者大会宣布 openPangu 2.0 开源大模型，分为 Pro（505B/18B 激活）和 Flash（92B/6B 激活）两个版本。512K 上下文窗口，鸿蒙智能体深度适配，昇腾算力深度调优。6月30日起分批开源7大核心组件。余承东喊话："字典里没有第二，只有第一！"

东方财富 · 2天前

💡 开发者影响：昇腾生态开源模型，国产推理部署首选

突破架构

Google 发布 DiffusionGemma：扩散架构生成快 4 倍，消费级显卡可跑

谷歌推出实验性开源模型 DiffusionGemma，采用文本扩散架构替代传统自回归。26B MoE 参数但推理仅激活 3.8B，量化后在 18GB 显存消费级显卡上即可运行。支持双向注意力与并行生成，适用于行内编辑、代码补全等实时交互场景。已通过 Apache 2.0 许可证在 HuggingFace 开源。

PingWest · 3天前

💡 开发者影响：扩散架构新范式，本地推理部署门槛降低

前沿追踪

OpenAI 剑指 GPT-5.6：150 万上下文，秘密提交 IPO 申请

GPT-5.6 内部代号 "iris-alpha"，已在 OpenAI Codex 后台日志中发现踪迹，上下文长度可能达到 150 万 tokens。市场预测 6 月底前发布概率超过 70%。与此同时，OpenAI 已于 6 月 8 日向 SEC 秘密提交 IPO 申请，Sam Altman 预计 "明年内" 上市。2026 年预计亏损约 140 亿美元。

C114 · 近日

💡 开发者影响：150 万上下文将重新定义 Agent 应用边界

生态动态

DeepSeek 完成 500 亿融资，V4 系列定价仅为国际同类 2%

DeepSeek 首轮融资约 500 亿元人民币，投后估值最高达 4000 亿元。创始人梁文锋个人出资 200 亿元，腾讯拟投 100 亿，宁德时代拟投 50 亿。DeepSeek-V4 系列已全面支持百万上下文，定价仅为国际同类产品约 2%，并主动退还缓存计费偏差赠金。市场预计 V4.1 版本将在 6 月推出。

证券时报 · 近日

💡 开发者影响：极致性价比模型 API，适合高频大批量调用

工具 & 部署 Tools & Deploy

💻

小米 MiMo Code

开源终端 AI 编程助手，基于 OpenCode 二次开发，MIT 协议。内置持久记忆系统与 Compose 模式，覆盖设计→规划→编码→测试→审查全流程。在 SWE-Bench Pro V2 和 Terminal Bench 2 上均超 Claude Code 约 5 个百分点。

开源 MIT

⚙

vLLM v0.22.1

最新版修复多节点 Ray 数据并行挂起问题，新增 AMD Zen CPU 量化推理与 JetBrains Mellum v2 支持。CUDA_VISIBLE_DEVICES 重构为 --device-ids 参数，修复 DeepSeek-V4 初始化问题。

更新

🏆

Xcode 27 Beta

苹果在 Xcode 27 Beta 中原生集成 Google Gemini，使其成为继 OpenAI Codex 和 Claude Agent 之后第三个内置 AI 编程智能体。开发者无需切换工具即可完成多步骤开发任务。

新集成

部署实战

K8s 成为 AI/ML 默认生产平台，GPU 利用率可提至 85%

KubeCon 2026 确认 Kubernetes 已成为 AI/ML 工作负载的默认生产平台。vLLM 成为 LLM 推理事实标准引擎，KServe 从 CNCF 毕业。通过多租户调度，GPU 利用率可从行业基线 25%-35% 提升至 60%-85%。

💡 开发者影响：K8s + vLLM 成标准部署栈，建议尽早熟悉

政策 & 合规 Policy & Compliance

监管升级

中央网信办启动「清朗·整治AI应用乱象」专项行动，已备案模型达868款

中央网信办部署为期 4 个月的专项行动，重点整治"应备未备"、语料安全、数据投毒、生成内容标识不到位等 7 类问题。截至 2026 年 4 月 30 日，全国已完成 868 款大模型备案、530 款应用登记。同时开设涉 AI 应用乱象举报专区（12377），受理 14 类违规问题。举报渠道包括网站 www.12377.cn、微信公众号"全国网络举报"等。

新华网 · 6月12日

💡 开发者影响：上线前务必完成备案登记，合规成本上升

数据制度

国家数据局推进 AI 数据制度建设：三权分置 + 合成数据研究

国家数据局召开"完善数据相关规则赋能人工智能创新发展"座谈会，DeepSeek、字节跳动、阿里云、腾讯等参与。随后印发实施方案，提出落实数据持有权、使用权、经营权三权分置，研究合成数据等新议题，推动版权作品数据有序用于模型训练。证监会亦发布新指引，要求资本优先配置 AI 与先进制造领域。

国家数据局 · 6月8日

💡 开发者影响：数据合规使用将成为模型训练前置条件

论文速递 Paper Spotlight

📚 本周精选 · ICML 2026

FLARE: Diffusion for Hybrid Language Model — 自回归与扩散统一框架

发表于 arXiv（2606.01774），提出首个自回归+扩散统一训练框架，单个 checkpoint 同时支持 AR 验证式解码和扩散式并行去噪。实验表明，迁移数据质量是能力保留的关键因素，而非损失函数或注意力掩码设计。这为 LLM 推理阶段提供了灵活的"速度-质量"权衡选择。

arXiv:2606.01774 · 6月1日 · 被引趋势：上升中

💡 开发者影响：统一 AR/扩散架构或将改变推理部署策略选择

应用落地 Real-World AI

🚀 生态级落地

微信开放 AI Agent 生态：一句话叫车点外卖不跳转

微信向 14.32 亿月活用户开放 AI Agent 能力，首批接入美团、滴滴、京东、携程等。用户一句话即可完成叫车、点外卖、订酒店等操作，全程不跳转。提供自动/开发两种接入模式，目前内测中。这标志着腾讯系、阿里系、字节系形成 AI 消费入口"三国杀"格局。

北京商报 · 6月9日

💡 开发者影响：微信 AI 生态催生大量小程序 Agent 开发机会

🏭 产业级落地

找钢网 AI 智能体：交易效率提升 10 倍，日均处理千万条消息

找钢网 AI 智能体实现"沟通即交易，对话即下单"，获央视《朝闻天下》专题报道。日均处理超 1000 万条交易消息，解析准确率超 95%。2025 年 AI 业务收入 3.35 亿元，同比增长 217.5%。与腾讯云 ADP 平台深度合作，推出"找钢 Claw"智能助手。

北京日报 · 6月11日

💡 开发者影响：产业 AI Agent 从问答走向交易闭环，ROI 可量化

开源热度 Open Source Pulse

📈 GitHub Trending — AI 领域 Top 5

1headroom+13K stars/周

2hermes-agent+11.5K stars/周

3turbovec+1.6K stars/日

4odysseus+1K stars/日

5Agent-Reach+796 stars/日

📈 趋势解读

上下文压缩 headroom 可节省 60-95% Token 成本，反映 Agent 工作流对 Token 优化的刚需。

记忆增强 Agent hermes-agent 190K 总星数，记忆功能成为 Agent 标配。

自托管 AI odysseus 引领私有本地部署趋势。

中文平台集成 Agent-Reach 支持 B 站、小红书，打破英文工具垄断。

💡 Rust + Python 模式在高性能 AI 基础设施中持续流行

海外参考 Global Brief

🌏 国际合作

Sam Altman 今日访韩，会晤三星、Naver 探讨 AI 合作

OpenAI CEO 奥尔特曼于 6 月 14 日访问韩国，计划会见三星电子、Naver、Kakao 等企业高管。议程包括三星 DX 部门 AI 转型、KakaoTalk 集成 ChatGPT、Naver 云合作，以及探讨 5000 亿美元 "Stargate" AI 数据中心项目的存储芯片供应。此前三星已宣布向全体员工开放 ChatGPT、Gemini、Claude 三种外部 AI。

💡 开发者影响：多模型企业策略成为趋势，单一平台绑定减弱

💬 社区热议

Hacker News 热议：AI 泡沫是否破裂？"AI Slop"指控成社交门槛工具

Hacker News 六月初热议 AI 泡沫。研究发现 "AI slop" 指控在 Reddit 和 HN 上增长 10 倍以上，94% 的负面 AI 指控使用该标签，现更多被用于社交身份标记而非真实检测。同时引发讨论的还有 AI 编程工具引入安全漏洞、Claude Code 源码泄露、UC Berkeley CS 挂科率飙升与 AI 依赖的关联等。

💡 开发者影响：AI 工具实用主义回归，过度炒作正在退潮

🏛️ 政策动向

亚马逊 CEO 与特朗普政府就 AI 大模型通话，行业监管博弈升温

亚马逊 CEO 安迪·贾西与其他科技企业负责人与特朗普政府就 AI 大模型进行通话，讨论产业政策与监管方向。与此同时，Alphabet 提议 800 亿美元股权融资用于 AI 基础设施建设，S&P 500 拒绝将 OpenAI、Anthropic 等 AI 公司快速纳入指数，市场对 AI 投资回报的审慎情绪上升。

💡 开发者影响：海外 AI 政策不确定性增加，关注出口管制变化

今日 AI 脉搏