返回简报首页
05-18
AI DAILY BRIEFING

AI 新知简报

05-18

Agent 竞争正在转向 Harness:今天最有价值的信号都指向同一层:模型之外的执行环境、反馈系统、上下文边界、模型路由和真实任务验证。

ChatGPT Images 2.0 在印度已超过 10 亿张图DeepSeek 把“Model + Harness = Agent”写进招聘信号ChatGPT Images 2.0 印度 10 亿张图
3 条重点 7 条链接 2 条判断
ISSUE MAP

本期趋势地图

先用一张图看清主线,再展开读正文。

HOT SIGNALS

今日最热

不是热闹,是今天最该看的 6 个信号。

01 @sama,晨报已报,作为今日主线延展

ChatGPT Images 2.0 在印度已超过 10 亿张图

Sam Altman 披露印度用户已在 ChatGPT Images 2.0 生成超过 10 亿张图片。这个数字说明图像生成已经不是小众创作工具,而是在高人口、高移动端使用率市场里变成消费级入口。

查看原文
02 @dotey,晨报已报,作为今日主线延展

DeepSeek 把“Model + Harness = Agent”写进招聘信号

DeepSeek 招 Agent Harness 产品经理,岗位覆盖桌面端 Agent、内部真实任务反馈、模型与 Harness 共同进化、用户社群信号提炼。看点不在招聘本身,而是国内头部模型团队正在把 Agent 胜负手从模型能力推进到执行环境和反馈闭环。

查看原文
03 @dotey,原文 256 👍/转评

OpenAI 把 ChatGPT、Codex、API 收到同一个产品叙事里

dotey 整理称 Greg Brockman 正式接管 OpenAI 产品战略,ChatGPT、Codex、API 被整合进同一核心产品团队。Codex 的增长速度和“agentic future”正在反向塑造 ChatGPT:未来差异不只是聊天,而是谁能把执行能力放进统一入口。

查看原文
CURATED DIGEST

分组精华

按来源分组,保留有效信息,去掉废话和重复语气。

创始团队

ChatGPT Images 2.0 在印度生成量破 10 亿张,说明 OpenAI 的多模态消费入口正在由英语核心市场外溢到超大规模移动端市场。(原文:https://fixupx.com/sama/status/2056165722804654196)

查看原帖

把“带两台电脑”调侃成“双持”,低信号但能看出 AI 开发者工作流正在从单终端变成多设备、多入口切换。(原文:https://fixupx.com/trq212/status/2056145415867937182)

查看原帖
研究顶级心智

许多心理偏差不是非理性,而是生物系统在实时约束和能量预算下形成的高效捷径。这对 Agent 设计也有启发:所谓“偏差”常常是资源约束下的策略。(原文:https://fixupx.com/fchollet/status/2055346225092902924)

查看原帖

推荐 Project Tapestry 相关内容;本轮多为短评和播客转发,保留为研究圈脉搏,不强行拔高。(原文:https://fixupx.com/ylecun/status/2056068940825030965)

查看原帖

本轮未出现足够新的高信号原创入选项,保留在原始抓取记录中。

工程实战

5 位 AI 原型工具构建者的共同结论是“先让 AI 暂停再构建”:截图沉淀基线、先出计划、先写迷你 PRD、批量生成再淘汰。约束越清楚,后面 30 分钟越接近可交付。(原文:https://fixupx.com/aakashgupta/status/2056133169955615197)

查看原帖

Citadel 的 Ken Griffin 从 Davos 的 AI 怀疑者,四个月后承认工具已能替代高薪分析工作的一部分。重点不是“AI 完美”,而是不可靠工具也已经在高价值环节产生替代压力。(原文:https://fixupx.com/aakashgupta/status/2056205893298188541)

查看原帖

Claude Skill 的 description 是路由逻辑,不是简介。技能文件不会全量读入,描述写不好,技能就会在触发阶段死掉。(原文:https://fixupx.com/aakashgupta/status/2056117310407188924)

查看原帖

AI Agent 上生产不能只靠感觉,需要测试集和部署后检查;“会不会幻觉、会不会被操纵”必须变成可跑的验收项。(原文:https://fixupx.com/godofprompt/status/2055633722083344523)

查看原帖

Codex 进入 ChatGPT iOS 后,可能推动公司配发手机,因为代码执行入口正在进入移动端。(原文:https://fixupx.com/NickADobos/status/2056172137975832968)

查看原帖
开源评测

质疑 HTML-first workflow 的 token 成本:同样报告,Markdown 约 800 tokens,样式化 HTML 可能 2500-4000 tokens。它提醒大家别把“可视化产物”误当成“推理质量”。(原文:https://fixupx.com/godofprompt/status/2055664651057418704)

查看原帖
中文精选

Codex Side Chat 的系统提示词重点是“边界”:继承上下文只作参考,不能把父线程里的任务当成当前指令。这是多线程 Agent 产品必须处理的安全边界。(原文:https://fixupx.com/dotey/status/2055551934317122014)

查看原帖

ChatGPT 金融账户连接功能把“建议”推向“办理”:美国 Pro 用户可绑定银行、投资、信用卡账户,并在 ChatGPT 内基于真实数据提问;隐私与金融记忆会成为采用门槛。(原文:https://fixupx.com/dotey/status/2055365342445322385)

查看原帖

Hermes 给出国内外模型配置清单,OpenAI Codex、xAI、Gemini、DeepSeek、Kimi、小米等被放进同一个多模型路由视角。(原文:https://fixupx.com/vista8/status/2056170241147977741)

查看原帖

微信读书 Skill / CLI 进入个人知识库工作流,可读取划线和分析读书数据,说明“个人数据源 + Skill”开始变成日常工具。(原文:https://fixupx.com/vista8/status/2055830488011735519)

查看原帖
EDITOR'S TAKE

今日判断

01

Agent 竞争正在转向 Harness:今天最有价值的信号都指向同一层:模型之外的执行环境、反馈系统、上下文边界、模型路由和真实任务验证。

02

入口比能力更快改变采用路径:图像生成在印度破 10 亿、Codex 进移动端、金融账户进 ChatGPT,说明“在哪用”正在和“能做什么”同等重要。

AI 新知简报 05-18 趋势地图放大预览