返回简报首页
05-22
AI DAILY BRIEFING

AI 新知简报

05-22

coding agent 的竞争焦点正在从“单次代码能力”转向“上下文入口、长期执行、成本可观测、团队分发和权限治理”。

Codex 新版把 coding agent 推向“长任务协作平台”Claude Code 开始把 token 花费拆到 Skills、Agents、MCP 和 Plugins
3 条重点 0 条链接 2 条判断
ISSUE MAP

本期趋势地图

先用一张图看清主线,再展开读正文。

HOT SIGNALS

今日最热

不是热闹,是今天最该看的 6 个信号。

01

Codex 新版把 coding agent 推向“长任务协作平台”

看点:OpenAI 今天的 Codex 更新已经在晨报报道;午报继续保留为今日主线延展。Appshots 把屏幕和窗口上下文直接送进 Codex,/goal 正式化后可跑数小时到数天的任务,浏览器标注和团队插件共享则把设计、工程、管理拉进同一条工作流。 为什么重要:Codex 不只是补一个写代码功能,而是在补“上下文入口、长任务状态、团队工具分发、协作批注”这四个企业化环节。

查看原文
02

Claude Code 开始把 token 花费拆到 Skills、Agents、MCP 和 Plugins

看点:Boris Cherny 预告下一版 Claude Code 可用 /usage 查看 token 到底被哪些 Skills、Agents、MCP、Plugins 消耗;CLI 先上,Desktop 随后跟进。 为什么重要:agent 工具进入团队后,成本不再是总账单问题,而是工作流组件级可观测性问题。能拆账,才可能优化、限额和治理。

查看原文
03

“自动化越多,人类工作越多”的组织信号变强

看点:Dan Shipper 说 Every 已尽可能用 AI agents 自动化工作,但员工数仍从 4 人涨到 30 人。他的新报告《After Automation》讨论 AI 如何让专家能力变便宜,反而推高专家需求。 为什么重要:这给“AI 会不会替代团队”提供了更细的判断:先被替代的可能是低价值转换和重复执行,随后需求会涌向能定义问题、校验结果、组织工作流的人。

查看原文
CURATED DIGEST

分组精华

按来源分组,保留有效信息,去掉废话和重复语气。

官方/创始团队

Claude Code 将提供 /usage 成本拆解,能看到 Skills、Agents、MCP、Plugins 分别消耗多少 token。这是 agent 工具从个人爽用走向团队治理的基础能力。(原文)

查看原帖
工程实战

Every 的实践显示,AI agents 自动化没有让人类工作消失,反而让团队扩张;核心解释是专家能力变便宜后,组织会做更多原先做不起的事。(原文)

查看原帖

AI 基础设施行业正在获得真实商业回报,受益者不是最性感的研究层,而是“无聊但关键”的 infra。(原文)

查看原帖

很多 PM 只把 Claude 当聊天框,实际只用了约 25% 能力;文件工作流、并行 agents、移动端派发、持续上下文才是下一层杠杆。(原文)

查看原帖
开源评测

围绕 GPQA-Diamond、Elo 和模型真实能力的争论继续发酵。重点不是某个榜单绝对正确,而是哪些评测能跨多年持续区分模型能力。(原文)

查看原帖

SGLang 的 decode KV cache / Mooncake recovery 修复已在晨报展开,午报作为主线背景保留:推理系统正在补高并发、低延迟和稳定恢复这些硬工程能力。(原文)

查看原帖
中文精选

Codex 新功能可概括为四件事:Appshots 输入上下文、/goal 跑长任务、浏览器内标注前端修改、Business 团队共享插件。晨报已报,作为今日主线延展。(原文)

查看原帖

微软开始收回内部 Claude Code license,要求部分团队迁往 GitHub Copilot CLI。表面是统一工具链,背后也有成本和竞争关系。(原文)

查看原帖

Codex / Claude Code 已能接管 VPS、Cloudflare DNS、HTTPS 证书等运维流程。普通用户开始把“顶级运维工程师”能力外包给 agent。(原文)

查看原帖

多 agent 使用越久,越会发现频繁上下文切换本身成为生产力瓶颈,这也解释了为什么“一个总控 agent + 可管理子任务”会变重要。(原文)

查看原帖
EDITOR'S TAKE

今日判断

01

coding agent 的竞争焦点正在从“单次代码能力”转向“上下文入口、长期执行、成本可观测、团队分发和权限治理”。

02

自动化并不天然减少工作量。它先降低专家能力的边际成本,再把瓶颈推向判断、组织和验证。

AI 新知简报 05-22 趋势地图放大预览