AI DAILY BRIEFING

AI 新知简报

05-18

Agent 竞争正在转向 Harness：今天最有价值的信号都指向同一层：模型之外的执行环境、反馈系统、上下文边界、模型路由和真实任务验证。

ChatGPT Images 2.0 在印度已超过 10 亿张图DeepSeek 把“Model + Harness = Agent”写进招聘信号ChatGPT Images 2.0 印度 10 亿张图

3 条重点 7 条链接 2 条判断

ISSUE MAP

本期趋势地图

先用一张图看清主线，再展开读正文。

HOT SIGNALS

今日最热

不是热闹，是今天最该看的 6 个信号。

01 @sama，晨报已报，作为今日主线延展

ChatGPT Images 2.0 在印度已超过 10 亿张图

Sam Altman 披露印度用户已在 ChatGPT Images 2.0 生成超过 10 亿张图片。这个数字说明图像生成已经不是小众创作工具，而是在高人口、高移动端使用率市场里变成消费级入口。

查看原文

02 @dotey，晨报已报，作为今日主线延展

DeepSeek 把“Model + Harness = Agent”写进招聘信号

DeepSeek 招 Agent Harness 产品经理，岗位覆盖桌面端 Agent、内部真实任务反馈、模型与 Harness 共同进化、用户社群信号提炼。看点不在招聘本身，而是国内头部模型团队正在把 Agent 胜负手从模型能力推进到执行环境和反馈闭环。

查看原文

03 @dotey，原文 256 👍/转评

OpenAI 把 ChatGPT、Codex、API 收到同一个产品叙事里

dotey 整理称 Greg Brockman 正式接管 OpenAI 产品战略，ChatGPT、Codex、API 被整合进同一核心产品团队。Codex 的增长速度和“agentic future”正在反向塑造 ChatGPT：未来差异不只是聊天，而是谁能把执行能力放进统一入口。

查看原文

CURATED DIGEST

分组精华

按来源分组，保留有效信息，去掉废话和重复语气。

创始团队

@sama

ChatGPT Images 2.0 在印度生成量破 10 亿张，说明 OpenAI 的多模态消费入口正在由英语核心市场外溢到超大规模移动端市场。（原文：https://fixupx.com/sama/status/2056165722804654196）

查看原帖

@trq212

把“带两台电脑”调侃成“双持”，低信号但能看出 AI 开发者工作流正在从单终端变成多设备、多入口切换。（原文：https://fixupx.com/trq212/status/2056145415867937182）

查看原帖

研究顶级心智

@fchollet

许多心理偏差不是非理性，而是生物系统在实时约束和能量预算下形成的高效捷径。这对 Agent 设计也有启发：所谓“偏差”常常是资源约束下的策略。（原文：https://fixupx.com/fchollet/status/2055346225092902924）

查看原帖

@ylecun

推荐 Project Tapestry 相关内容；本轮多为短评和播客转发，保留为研究圈脉搏，不强行拔高。（原文：https://fixupx.com/ylecun/status/2056068940825030965）

查看原帖

@demishassabis / @drfeifei / @lilianweng

本轮未出现足够新的高信号原创入选项，保留在原始抓取记录中。

工程实战

@aakashgupta

5 位 AI 原型工具构建者的共同结论是“先让 AI 暂停再构建”：截图沉淀基线、先出计划、先写迷你 PRD、批量生成再淘汰。约束越清楚，后面 30 分钟越接近可交付。（原文：https://fixupx.com/aakashgupta/status/2056133169955615197）

查看原帖

@aakashgupta

Citadel 的 Ken Griffin 从 Davos 的 AI 怀疑者，四个月后承认工具已能替代高薪分析工作的一部分。重点不是“AI 完美”，而是不可靠工具也已经在高价值环节产生替代压力。（原文：https://fixupx.com/aakashgupta/status/2056205893298188541）

查看原帖

@aakashgupta

Claude Skill 的 description 是路由逻辑，不是简介。技能文件不会全量读入，描述写不好，技能就会在触发阶段死掉。（原文：https://fixupx.com/aakashgupta/status/2056117310407188924）

查看原帖

@godofprompt

AI Agent 上生产不能只靠感觉，需要测试集和部署后检查；“会不会幻觉、会不会被操纵”必须变成可跑的验收项。（原文：https://fixupx.com/godofprompt/status/2055633722083344523）

查看原帖

@NickADobos

Codex 进入 ChatGPT iOS 后，可能推动公司配发手机，因为代码执行入口正在进入移动端。（原文：https://fixupx.com/NickADobos/status/2056172137975832968）

查看原帖

开源评测

@godofprompt

质疑 HTML-first workflow 的 token 成本：同样报告，Markdown 约 800 tokens，样式化 HTML 可能 2500-4000 tokens。它提醒大家别把“可视化产物”误当成“推理质量”。（原文：https://fixupx.com/godofprompt/status/2055664651057418704）

查看原帖

中文精选

@dotey

Codex Side Chat 的系统提示词重点是“边界”：继承上下文只作参考，不能把父线程里的任务当成当前指令。这是多线程 Agent 产品必须处理的安全边界。（原文：https://fixupx.com/dotey/status/2055551934317122014）

查看原帖

@dotey

ChatGPT 金融账户连接功能把“建议”推向“办理”：美国 Pro 用户可绑定银行、投资、信用卡账户，并在 ChatGPT 内基于真实数据提问；隐私与金融记忆会成为采用门槛。（原文：https://fixupx.com/dotey/status/2055365342445322385）

查看原帖

@vista8

Hermes 给出国内外模型配置清单，OpenAI Codex、xAI、Gemini、DeepSeek、Kimi、小米等被放进同一个多模型路由视角。（原文：https://fixupx.com/vista8/status/2056170241147977741）

查看原帖

@vista8

微信读书 Skill / CLI 进入个人知识库工作流，可读取划线和分析读书数据，说明“个人数据源 + Skill”开始变成日常工具。（原文：https://fixupx.com/vista8/status/2055830488011735519）

查看原帖

EDITOR'S TAKE

今日判断

Agent 竞争正在转向 Harness：今天最有价值的信号都指向同一层：模型之外的执行环境、反馈系统、上下文边界、模型路由和真实任务验证。

入口比能力更快改变采用路径：图像生成在印度破 10 亿、Codex 进移动端、金融账户进 ChatGPT，说明“在哪用”正在和“能做什么”同等重要。