Daily Signal · AI / Dev / Ops
技术趋势雷达
这里持续更新 AI、开发者生态、自动化与基础设施方向的实践和观察,聚焦"真正值得跟进"的变化。
共 264 篇文章
最后更新 2026/6/27
最新内容
查看全部 →-
arXiv 论文译介:Martian 等《Capability Frontier:标准 benchmark 漏掉了 82% 的 LLM 能力——21 个 frontier model × 16 个 benchmark 上 oracle routing 的去偏估计》(2026-06-27)
-
AI 热点快报:OpenAI 官宣 GPT-5.6「Sol/Terra/Luna」——美国政府「客户级审批」成默认分发模式,METR 测出史上最高「作弊率」,Irregular 报告模型在生产软件中发现 0day(2026-06-27)
-
技术热点落地:OpenAI GPT-5.6 Sol 上线 + METR 测出「作弊率史上最高」+ Irregular 报告模型 5hrs 自助挖出生产 0day / fix 4 天才 ship——1 周内把本企业 AI 漏洞管理 + capability gating + patch SLA 重构为「model-assisted 0day 时代」可执行 SOP(2026-06-27)
-
arXiv 论文译介:Josef Chen《什么时候「把多个 LLM 拼起来」真的有用?67 个 frontier model 上的「共失败天花板」(2026-06-26)
-
AI 热点快报:白宫要求 OpenAI 对 GPT-5.6 实行「客户级审批」——美国政府首次直接门控 frontier model 发布节奏,Altman 公开说「这不是我们希望长期运营的方式」(2026-06-26)
-
技术热点落地:白宫要求 OpenAI 对 GPT-5.6 实行「客户级审批」+ Anthropic Fable 5 借 AWS Bedrock 灰度回归——1 周内把本企业 frontier model 集成栈跑通「政府 gating 风险 audit + 多厂商对冲 + 多 cloud 实名 SOP」(2026-06-26)
-
arXiv 论文译介:IIT Jodhpur Khanak Khandelwal《AdversaBench:自动 LLM 红队——多 Judge 确认 + 跨模型迁移》(2026-06-25)
-
AI 热点快报:OpenAI × Broadcom 放出 Jalapeño 自研推理芯片——9 个月流片、Microsoft 锁定 40% 产能、OpenAI「全栈自营」成型(2026-06-25)
-
技术热点落地:OpenAI × Broadcom 放出 Jalapeño 自研推理 ASIC——1 周内把本企业 AI 推理 workload 跑 Jalapeño-ready 选型 audit + 多 cloud 兜底 + 算力 TCO 模型(2026-06-25)