Anthropic 把 Agent 能力继续往“长程软件工程”推。
工程博客提到用 multi-agent harness 去提升前端设计与长期 автономous software engineering 的效果,信号很明确:Agent 不再只比“会不会调工具”,而在比复杂任务里的协作与稳定性。 (@AnthropicAI,https://x.com/AnthropicAI/status/2036481033621623056)
- Agent 赛道的重心,正在从“能不能自主”转向“能不能稳定交付”。
不是热闹,是今天最该看的 6 个信号。
工程博客提到用 multi-agent harness 去提升前端设计与长期 автономous software engineering 的效果,信号很明确:Agent 不再只比“会不会调工具”,而在比复杂任务里的协作与稳定性。 (@AnthropicAI,https://x.com/AnthropicAI/status/2036481033621623056)
与其在“全手动审批”和“彻底放权”之间二选一,Anthropic 选择用分类器来替用户做一部分审批判断。背后的重点不是炫技,而是让自动化更可控。 (@AnthropicAI,https://x.com/AnthropicAI/status/2036944806317088921)
一边是 Boris Cherny 低估功能清单被中文详细拆解;一边是中关村论坛上围绕 OpenClaw、Agent、long context、infra 的高密度讨论被整理出来。说明讨论正在从“尝鲜”转向“方法论沉淀”。 (@dotey,https://x.com/dotey/status/2038481514732691940)
按来源分组,保留有效信息,去掉废话和重复语气。
围绕 Claude Code 的使用生态仍在升温,开发者开始把它视为长期工作流的一部分,而不只是终端里的临时助手。
技术写作与技能(Skills)体系继续成为社区传播核心,Agent 时代的“文档即能力”越来越明显。
Every 推出托管式 OpenClaw「Plus One」,强调 Slack 驻场、预装 tools/skills/workflows,说明市场开始做“开箱即用的 AI 同事”,不再满足于给你一个空壳。 (https://x.com/danshipper/status/2037187519515603297)
查看原帖create-context-graph 这类工具引起关注,反映出一个趋势:大家开始主动给应用补“上下文图谱层”,让 Agent 不只会调工具,还能理解关系。 (https://x.com/swyx/status/2037620876179537989)
查看原帖把 Claude Code 的 15 个低估功能拆成中文实战说明,包括移动端、remote control、loop/schedule、hooks、worktrees、batch 等,信息密度很高,适合直接拿来改工作流。 (https://x.com/dotey/status/2038481514732691940)
查看原帖整理了 OpenClaw / Agent 圆桌,几条值得记:模型正从聊天转向干活、long context 与推理成本是关键、planning/memory/skill 仍是 Agent 三大痛点。 (https://x.com/Khazix0918/status/2037424637802668481)
查看原帖直接建议让 Claude 复盘你的历史对话与项目,反推上下文管理改进方向。说明中文圈也开始从“怎么用 AI”走向“怎么让 AI 长期更好用”。 (https://x.com/yanhua1010/status/2037465513253810515)
查看原帖- Agent 赛道的重心,正在从“能不能自主”转向“能不能稳定交付”。
- 中文圈这两周一个明显变化,是从围观新工具,转向沉淀可复用工作流。