早间版 · 08:00 CST · 18条精选
今日 AI 脉搏
2026年6月23日 · 星期二
18
头条新闻
8
信源覆盖
10
热门项目
1
精选论文
TL;DR
智谱 GLM-5.2 MIT 全面开源 · DeepSeek V3.2 发布对标 GPT-5 · Meta 放弃 Llama 转向闭源 Muse Spark · 中国三部门联合发文规范智能体发展 · MiniMax M3 稀疏注意力架构 1M 上下文 · Anthropic Claude Cowork 进军企业协作
模型大模型动态
Model Updates
🇨🇳 HEADLINE · 智谱AI · 6月22日
GLM-5.2 全面开放,753B 参数 MIT 开源,Code Arena 排名第二
智谱 AI 宣布 GLM-5.2 面向全量用户开放,API 与模型本体均采用 MIT 开源协议。该模型为 753B 参数 MoE 架构,在 Code Arena 排名第二,SWE-bench Pro 得分 62.1,仅次 OpenAI 旗舰。首创 IndexShare 注意力优化技术,每 token FLOPs 降低 2.9×。英文科技媒体评价其为「让硅谷侧目的中国开源力量」。智谱同步推进科创板上市进程。
开发者影响:MIT 协议无商用限制,753B 模型 API 即日可用。IndexShare 降低推理成本,适合中文场景 Agent 开发和高吞吐量应用。
🇨🇳 OPEN SOURCE · DeepSeek
DeepSeek V3.2 / V3.2-Speciale 发布,MIT 开源对标 GPT-5
685B 参数,128K 上下文,MIT 协议。IMO 和 IOI 2025 金牌级表现,稀疏注意力将推理成本降低约 70%。V3.2-Speciale 为专业推理增强版,多项基准与 GPT-5 互有胜负。API 定价仅为竞争对手的 1/10~1/20。
🌍 META · 闭源转型
Meta 放弃 Llama 开源路线,发布闭源推理模型 Muse Spark
Meta Superintelligence Labs 推出首款闭源模型 Muse Spark,引入「视觉思维链」(visual chain of thought),Intelligence Index 得分 52。这标志着 Meta 从 Llama 开源战略的重大转向,引发开源社区震动。
🇨🇳 MINIMAX · 架构创新
MiniMax M3 发布:自研稀疏注意力 MSA,1M 上下文计算量降至 1/20
MiniMax 推出全新 M3 模型,自研 MSA 稀疏注意力架构在 100 万 token 上下文下计算量仅为上一代的 1/20。具备前沿 Coding 能力、1M 超长上下文和原生多模态。公司已启动 A 股科创板 IPO。
🌍 BLACK FOREST LABS
Black Forest Labs 开源 FLUX.2 [klein],一秒内生成 AI 图片
Stable Diffusion 原团队创业项目发布 FLUX.2 [klein] 系列:4B 参数版本 Apache 2.0 开源,9B 版本非商用许可。在消费级 GPU 上实现亚秒级图片生成,速度比前代提升 8×。
工具工具 & 部署
Tools & Frameworks
DeepSeek-TUI
「DeepSeek 版 Claude Code」——终端原生编程智能体,支持 Plan/Agent/YOLO 三种模式,原生 MCP + Skills,9.47 元即可开发一个 App。GitHub 屠榜中。
趋势 #1
36氪 →
PilotDeck 智能体 OS
清华 THUNLP + 面壁智能 + OpenBMB 联合开源。独立 WorkSpace 隔离、白盒化可编辑记忆、智能路由节省 Token 70%。
新发布
36氪 →
Cohere North Mini Code
30B MoE (3B active) 开源代码 Agent,Apache 2.0,单 H100 可跑。2.8× 吞吐量超越 Mistral Devstral Small 2。
开源新秀
VentureBeat →
政策政策 & 合规
Policy & Regulation
🇨🇳 监管 · 三部门联合发文
三部门联合印发《智能体规范应用与创新发展实施意见》
国家网信办、发改委、工信部联合发文,首次明确定义「智能体」为具备自主感知、记忆、决策、交互与执行能力的智能系统。提出 19 个典型应用场景,覆盖科学研究、产业发展、民生福祉等领域,确立安全可控、分类分级、包容审慎的监管原则。
开发者影响:智能体产品即将迎来合规元年。涉及自主决策和用户数据的 Agent 应用需关注分类分级要求,安全可控和可解释性将成为产品上线必备项。
🌍 美国 · AI 监管战争
美国 AI 监管「内战」:州级立法爆炸式增长,联邦 vs 州权博弈加剧
MIT Tech Review 深度报道:2025 年美国各州提出 1000+ AI 法案,约 40 州通过了 100+ 项法律。纽约 RAISE Act、加州 SB 53 前沿 AI 安全法等重量级法案正在推进,与联邦去监管化政策形成激烈对抗。2026 年将成为 AI 立法「摊牌之年」。
📄
论文今日论文
EinsteinArena:AI Agent 在无人类干预下自主发现 12 项最新数学成果
研究团队构建了名为 EinsteinArena 的智能体原生平台,让多个 AI Agent 在分布式环境中自主探索科学研究。在约一个月运行中,Agent 发现了 12 项 SOTA 级数学成果,其中最引人注目的是将维度 11 的 kissing number 下界从 593 提升至 604——该问题自 1971 年以来未有进展。这标志着 AI 首次在纯数学研究中实现无人干预的突破性发现,为「AI 科学家」概念迈出关键一步。
阅读论文全文 →
应用应用落地
Applications
🏢 ENTERPRISE · Anthropic
Anthropic Claude Cowork 发布:从编程助手到企业全场景 Agent
继 Claude Code 改变编程后,Anthropic 推出 Claude Cowork——面向企业全场景的 Agent 平台。支持私有插件市场、MCP 连接器(GDrive/Gmail/Salesforce/DocuSign),企业管理员可构建内部 Agent 生态。Spotify 已实现代码迁移工程时间减少 90%,Novo Nordisk 将合规文档处理从 10+ 周压缩至 10 分钟。
🏢 ENTERPRISE · ServiceNow
ServiceNow 90% IT 请求实现自主处理,推出企业 Agent 劳动力平台
ServiceNow 披露内部 AI 部署数据:90% 的 IT 支持请求由 AI Agent 自主解决。发布「Autonomous Workforce」框架和 EmployeeWorks 产品,创新性地采用角色继承权限模型——Agent 直接从企业现有访问控制系统继承权限,而非运行时推理,确保合规先行。
开源热度
Open Source Pulse
🔥 本周 Stars 上升最快
1chopratejas/headroom+13k
2mvanhorn/last30days-skill+12k
3Leonxlnx/taste-skill+8.7k
4Panniantong/Agent-Reach+8.3k
5OpenBMB/PilotDeck+7.5k
📊 趋势关键词
🔥 Skills 范式 —— headroom Token 压缩 60-95% 登顶
🧠 Agent 基础设施 —— Agent-Reach 一键联网
🎨 AI 前端品质 —— taste-skill 反模板化 UI
🏗️ 智能体 OS —— PilotDeck 清华出品
🔌 跨平台接入 —— last30days-skill AI 驱动搜索
🧠 Agent 基础设施 —— Agent-Reach 一键联网
🎨 AI 前端品质 —— taste-skill 反模板化 UI
🏗️ 智能体 OS —— PilotDeck 清华出品
🔌 跨平台接入 —— last30days-skill AI 驱动搜索
数据来源:GitHub Trending W23-W25 · 整理自 cnblogs.com
查看完整周榜 →
查看完整周榜 →
海外海外参考
Global Brief
GOOGLE DEEPMIND
Google 发布 Gemini Spark —— 24/7 云端 AI Agent,对标 OpenClaw
Google I/O 2026 发布 Gemini Spark:通过 Google Cloud VM 实现 24×7 持续运行的 AI Agent,可自主处理邮件、管理日程、监控信用卡异常收费。同时发布 DiffusionGemma——首个基于扩散模型的文本生成模型,抛弃传统从左到右逐 token 生成,实现 4× 推理加速。
OPENAI
OpenAI GPT-5.4 发布:首个原生「Computer Use」模型,迈向自主 Agent
GPT-5.4 是 OpenAI 首个具备原生计算机操作能力的模型,可操作应用、跨设备完成任务。同步发布 GPT-5.4 Thinking 变体和 Codex 桌面 App(macOS),开发者可在本地并行运行多个 AI 编码 Agent。The Verge 评价其为「自主 Agent 的一大步」。
NVIDIA
Nvidia 开源 Parakeet-TDT-0.6B-V2:60 分钟音频 1 秒转录,WER 仅 6.05%
Nvidia 在 Hugging Face 完全开源轻量级语音识别模型 Parakeet-TDT-0.6B-V2,采用 TDT 架构实现极速推理——1 秒转录 60 分钟音频。WER 仅 6.05%,在边缘设备和云端场景均适用。
ANTHROPIC
Anthropic Sonnet 4.6:旗舰级性能,1/5 的价格,推动企业大规模采用
Sonnet 4.6 以 $3/$15 每百万 token 的定价(仅为 Opus 的 1/5)提供接近旗舰水平的性能。Computer Use 能力 16 个月内提升 5×(14.9%→72.5%)。1M token 上下文窗口。企业客户报告已将大部分流量迁移至 Sonnet 4.6。