返回简报首页
05-15
AI DAILY BRIEFING

AI 新知简报

05-15

今天的主线不是单一模型发布,而是“采纳基础设施”:Codex 一边进入 ChatGPT 手机 App,把 coding agent 变成随时可审批的长任务工作流,一边用试用额度抢企业迁移;Claude Code 则被入口体验和额度政策考验。

Codex 进入 ChatGPT 手机 App,OpenAI 把 coding agent 放进主入口OpenAI 用两个月免费 Codex 额度抢企业迁移窗口OpenAI 给企业两个月免费 Codex 用量:AI 编程进入迁移战
3 条重点 12 条链接 2 条判断
ISSUE MAP

本期趋势地图

先用一张图看清主线,再展开读正文。

HOT SIGNALS

今日最热

不是热闹,是今天最该看的 6 个信号。

01 @OpenAI / @dotey · 晨报已报,作为今日主线延展

Codex 进入 ChatGPT 手机 App,OpenAI 把 coding agent 放进主入口

看点:Codex 在 ChatGPT iOS/Android App 中开放预览,手机端不是写代码,而是启动任务、查看执行结果、审 diff、批准下一步;真正执行仍在 Mac、笔记本或 devbox 上。这是“长任务 agent + 移动审批入口”的关键产品形态,也说明 OpenAI 没给 Codex 单独做手机 App,而是把它并入 ChatGPT 超级入口。

查看原文
02 @sama · 官方/创始团队

OpenAI 用两个月免费 Codex 额度抢企业迁移窗口

看点:Sam Altman 表示 Codex 是“最好的 AI coding 产品”,未来 30 天给想切换的公司两个月免费 Codex 用量。信号很清楚:AI 编程工具的竞争从个人尝鲜转向企业迁移,价格/试用额度正在成为销售武器。

查看原文
03 @demishassabis · 研究/顶级心智

Isomorphic Labs 获 21 亿美元融资,AI 医药继续成为硬落点

看点:Demis Hassabis 强调 AI 的第一应用应是改善人类健康;AlphaFold 之后,Isomorphic Labs 以 21 亿美元新资金加速药物发现。相比工具层噪声,AI for health 仍是最有长期确定性的主线之一。

查看原文
CURATED DIGEST

分组精华

按来源分组,保留有效信息,去掉废话和重复语气。

官方

Codex 已进入 ChatGPT 手机 App 预览版,移动端承担“监督/审批/转向”角色,执行环境仍在 Mac、笔记本或 devbox;这条虽已在晨报出现,但属于全天主入口级新闻,必须保留为今日主线。(@OpenAI)

查看原帖

近 72 小时内未出现未重复的新原创入选;与 Claude Code 额度相关的官方信息已在今早晨报出现,本轮按规则不重复。

抓到的新帖信息密度低于扩展池高信号内容,保留在过滤记录中,不机械补位。

创始团队

Codex 对企业开放两个月免费试用,等于把“换工具”的摩擦降到最低;这是 OpenAI 把 coding agent 推进企业采购流程的明确信号。(@sama)

查看原帖

他也提到自己会焦虑没有使用最聪明的模型/设置,暗示产品定价可能更该围绕“速度 vs 智能”而不只是“价格 vs 智能”设计。(@sama)

查看原帖

本轮无未重复高信号新原创进入摘要。

研究顶级心智

Isomorphic Labs 获 21 亿美元融资,继续把 AlphaFold 路线推向药物发现;AI 医药仍是从模型能力走向产业结果的关键样板。(@demishassabis)

查看原帖

他把 symbolic learning 定位为替代梯度下降和神经网络的底层学习基底,而不是替代 coding agents;重点是“学习 substrate”之争,不是应用层工具之争。(@fchollet)

查看原帖

Google AI Studio 展示“智能鼠标指针”原型,把界面控制从被动点击推进到上下文感知的交互层。(@demishassabis)

查看原帖
工程实战

Claude Code 在 SSH 场景不能直接粘贴图片,暴露 CLI agent 在多模态和远程开发中的体验短板;入口形态正在影响采纳。(@theo)

查看原帖

他随后表示已取消 Claude Code 订阅,说明额度、SDK credit、第三方 harness 和体验摩擦正在转化为真实流失信号。(@theo)

查看原帖

组织 agent 化的领先指标不是培训,而是领导层自己每天用 Codex、Claude Code 或 Cowork;采纳先发生在决策层的肌肉记忆里。(@danshipper)

查看原帖

分享从零实现 LLM 架构的经验,强调通过参考实现对齐和比较 open-weight 模型,能帮助工程师真正理解模型结构而不是只调 API。(@rasbt)

查看原帖

开发者工具公司应该写高质量 tech stack 复盘;这既建立用户信任,也服务招聘、竞争壁垒和社区回馈。(@swyx)

查看原帖
开源评测

δ-mem 用一个小型外部状态接入 attention,避免无限扩 context 或重训模型,是更轻、更模块化的长期记忆路线。(@dair_ai)

查看原帖

Google DeepMind 的 AI Co-Mathematician 是面向数学家的 agentic research workbench,在 FrontierMath Tier 4 达到 48%,把研究代理从“答题”推进到“工作台”。(@dair_ai)

查看原帖

多智能体系统不一定提升推理,实验显示 agent 可能已经算出正确答案,却为了服从群体共识而压制结果;这类 “Sovereignty Gap” 值得做系统评测。(@dair_ai)

查看原帖

呼吁美国 AI 社区承认开放国际 AI,特别是 DeepSeek、Qwen、Kimi、GLM 等中国开源模型,对竞争和财富创造的贡献。(@ClementDelangue)

查看原帖
中文精选

详细解读 Codex 进 ChatGPT 手机 App:手机不是写代码,而是远程监督和批准跑在 Mac/devbox 上的任务;这补上了 agent 长任务场景里的移动审批入口。(@dotey)

查看原帖

Anthropic 提高 Claude Code 每周上限 50%,但 SDK/programmatic 调用 credit 单独封顶,说明“订阅跑自动化”的空间仍在收紧。(@dotey)

查看原帖

Google Cloud AI 工程师演示 26 分钟用 Claude 从想法到部署应用,价值在于把 agent coding 包装成可复制工程流程。(@yanhua1010)

查看原帖

AI 进团队的核心卡点不是模型聪明,而是没有记忆层、没有执行权;真正落地要能记住团队上下文并推动系统动作。(@LawrenceW_Zen)

查看原帖

做 AI 内容不能只看 AI,热点只是杠杆,长期内容能力来自讲故事、审美和跨领域输入。(@Khazix0918)

查看原帖
EDITOR'S TAKE

今日判断

01

今天的主线不是单一模型发布,而是“采纳基础设施”:Codex 一边进入 ChatGPT 手机 App,把 coding agent 变成随时可审批的长任务工作流,一边用试用额度抢企业迁移;Claude Code 则被入口体验和额度政策考验。

02

研究侧的共同方向是把 AI 从聊天框推进到工作台、记忆层和产业系统:数学研究、长期记忆、药物发现,都在寻找比 demo 更硬的落点。

AI 新知简报 05-15 趋势地图放大预览