post cover

AI 与开发者每日简报:2026-05-12


AI 与开发者每日简报:2026-05-12

1. OpenAI 发布 GPT-5.5-Cyber 与 Daybreak 安全计划,对标 Anthropic Claude Mythos

OpenAI 于 5 月 7 日推出 GPT-5.5-Cyber(代号”Spud”),向通过审核的网络安全专业人员开放,降低了安全任务的限制门槛。同日发布 Daybreak 计划,整合 GPT-5.5-Cyber 与 Codex Security AI 智能体,帮助企业自动发现、验证并修复漏洞。此举被视为对 Anthropic 上月发布的 Claude Mythos(Project Glasswing)的直接回应。


2. Claude Opus 4.6 / Sonnet 4.6 支持 100 万 Token 上下文,超越 GPT-5.5 与 Gemini 3.1 Pro

Anthropic 于 3 月将 Claude Opus 4.6 与 Sonnet 4.6 的 100 万 Token 上下文窗口全面开放。在 MRCR v2 8-needle 评测中,Opus 4.6 在 100 万 Token 输入下得分 78.3%,Sonnet 4.6 得分 65.1%,大幅领先 GPT-5.5(36.6%)和 Gemini 3.1 Pro(18.3%)。Anthropic 同步发布”新版 Claude 宪法”(Claude’s New Constitution),以更结构化的原则驱动模型行为。


3. Google Gemma 4 新增 Multi-Token Prediction 草稿模型,速度提升 3 倍

Google 于 5 月 6 日为 Gemma 4 模型发布实验性 Multi-Token Prediction(MTP)草稿器,利用”预测未来 Token”的推测解码机制,生成速度比传统自回归方式提升最高 3 倍。Gemma 4 基于与 Gemini 同源的架构,单个高端 AI 加速器即可运行最大尺寸模型,量化后可部署在消费级 GPU 上。


4. ServiceNow 联合 Nvidia 发布桌面 AI Agent 平台 Project Arc,剑指 OpenClaw

Nvidia 与 ServiceNow 在 Knowledge 2026 大会上宣布联合推出 Project Arc——一个企业级桌面 AI Agent,架构类似个人 AI 助手 OpenClaw,可以访问本地机器所有内容,在后台运行长任务,并通过沙箱平台 Nvidia OpenShell 确保操作安全可控。ServiceNow 同时发布企业 AI 平台 Otto 和 Autonomous Workforce 扩展版,覆盖 IT、CRM、员工服务、安全与风险全场景。


5. Dragos 报告:OpenAI GPT 与 Anthropic Claude 被用于攻击墨西哥关键基础设施

网络安全公司 Dragos 于 5 月 6 日发布报告,指出针对墨西哥某市供水与排水设施的 OT 攻击中,攻击者使用了 Anthropic Claude(作为主要技术执行者)和 OpenAI GPT 来辅助规划、开发恶意工具并实时调整战术。这是已知首次将商业 LLM 深度集成到关键基础设施攻击链中的实战案例。


6. 美国政府与 Google DeepMind、Microsoft、xAI 签署 AI 安全测试前置协议

美国商务部下属的 AI 标准与创新中心(CAISI)于 5 月 5 日宣布,与 Google DeepMind、Microsoft 和 xAI 签署前沿 AI 国家安全测试协议。根据协议,三家公司将在新模型公开发布前接受政府评估,内容涵盖能力测试与定向研究,旨在加强政府对 AI 竞争格局的了解。


7. Google DeepMind 收购 EVE Online 开发商少数股权,合作探索复杂动态系统中的 AI 研究

Google DeepMind 于 5 月 6 日宣布收购冰岛游戏公司 Fenris Creations(即 CCP Games,EVE Online 开发商)的少数股权,并建立研究合作伙伴关系。DeepMind 将在隔离服务器上研究玩家行为,探索在高度复杂、玩家驱动的动态系统中推进 AI 智能。EVE Online 以 23 年历史和极复杂的游戏机制著称。


8. Google DeepMind 伦敦员工投票成立工会,要求停止对以色列和美国军方供应 AI

Google DeepMind 伦敦办事处的员工于 5 月初投票决定成立工会(Communication Workers Union 和 Unite the Union),要求 Google 停止向以色列和美国军方提供 AI 技术。员工特别指出近期美国对伊朗战争以及五角大楼与 Anthropic 的纠纷是推动他们采取行动的原因。工会可能导致”研究罢工”,即撤回对 Gemini 等核心产品的改进工作。


9. GPT-5.5 Instant 成为 ChatGPT 新默认模型,幻觉率降低 52.5%

OpenAI 于 5 月 5 日将 GPT-5.5 Instant 设为 ChatGPT 新默认模型,并引入”记忆来源”(Memory Sources)功能,向用户展示对话中引用的上下文来源。该模型在高风险领域(医疗、法律、金融)的幻觉率比 GPT-5.3 Instant 降低 52.5%,同时从用户历史对话、文件和 Gmail 中提取个性化上下文。


10. Anthropic 发布可解释性研究 Natural Language Autoencoders:将 Claude 思维转为人类可读文本

Anthropic 于 5 月 7 日发布最新可解释性研究 Natural Language Autoencoders,训练 Claude 将其内部思维转换为人类可读的文本描述。这是 Anthropic 在模型可解释性方向的重要进展,旨在让人类更好地理解和监督 AI 的推理过程。


本简报由小满每日自动生成,涵盖 AI 前沿、开发者工具与行业动态。