Codex 进入 ChatGPT 手机 App,OpenAI 把 coding agent 放进主入口
看点:Codex 在 ChatGPT iOS/Android App 中开放预览,手机端不是写代码,而是启动任务、查看执行结果、审 diff、批准下一步;真正执行仍在 Mac、笔记本或 devbox 上。这是“长任务 agent + 移动审批入口”的关键产品形态,也说明 OpenAI 没给 Codex 单独做手机 App,而是把它并入 ChatGPT 超级入口。
查看原文今天的主线不是单一模型发布,而是“采纳基础设施”:Codex 一边进入 ChatGPT 手机 App,把 coding agent 变成随时可审批的长任务工作流,一边用试用额度抢企业迁移;Claude Code 则被入口体验和额度政策考验。
先用一张图看清主线,再展开读正文。
不是热闹,是今天最该看的 6 个信号。
看点:Codex 在 ChatGPT iOS/Android App 中开放预览,手机端不是写代码,而是启动任务、查看执行结果、审 diff、批准下一步;真正执行仍在 Mac、笔记本或 devbox 上。这是“长任务 agent + 移动审批入口”的关键产品形态,也说明 OpenAI 没给 Codex 单独做手机 App,而是把它并入 ChatGPT 超级入口。
查看原文看点:Sam Altman 表示 Codex 是“最好的 AI coding 产品”,未来 30 天给想切换的公司两个月免费 Codex 用量。信号很清楚:AI 编程工具的竞争从个人尝鲜转向企业迁移,价格/试用额度正在成为销售武器。
查看原文看点:Demis Hassabis 强调 AI 的第一应用应是改善人类健康;AlphaFold 之后,Isomorphic Labs 以 21 亿美元新资金加速药物发现。相比工具层噪声,AI for health 仍是最有长期确定性的主线之一。
查看原文按来源分组,保留有效信息,去掉废话和重复语气。
Codex 已进入 ChatGPT 手机 App 预览版,移动端承担“监督/审批/转向”角色,执行环境仍在 Mac、笔记本或 devbox;这条虽已在晨报出现,但属于全天主入口级新闻,必须保留为今日主线。(@OpenAI)
查看原帖近 72 小时内未出现未重复的新原创入选;与 Claude Code 额度相关的官方信息已在今早晨报出现,本轮按规则不重复。
抓到的新帖信息密度低于扩展池高信号内容,保留在过滤记录中,不机械补位。
Isomorphic Labs 获 21 亿美元融资,继续把 AlphaFold 路线推向药物发现;AI 医药仍是从模型能力走向产业结果的关键样板。(@demishassabis)
查看原帖他把 symbolic learning 定位为替代梯度下降和神经网络的底层学习基底,而不是替代 coding agents;重点是“学习 substrate”之争,不是应用层工具之争。(@fchollet)
查看原帖Google AI Studio 展示“智能鼠标指针”原型,把界面控制从被动点击推进到上下文感知的交互层。(@demishassabis)
查看原帖Claude Code 在 SSH 场景不能直接粘贴图片,暴露 CLI agent 在多模态和远程开发中的体验短板;入口形态正在影响采纳。(@theo)
查看原帖他随后表示已取消 Claude Code 订阅,说明额度、SDK credit、第三方 harness 和体验摩擦正在转化为真实流失信号。(@theo)
查看原帖组织 agent 化的领先指标不是培训,而是领导层自己每天用 Codex、Claude Code 或 Cowork;采纳先发生在决策层的肌肉记忆里。(@danshipper)
查看原帖分享从零实现 LLM 架构的经验,强调通过参考实现对齐和比较 open-weight 模型,能帮助工程师真正理解模型结构而不是只调 API。(@rasbt)
查看原帖开发者工具公司应该写高质量 tech stack 复盘;这既建立用户信任,也服务招聘、竞争壁垒和社区回馈。(@swyx)
查看原帖δ-mem 用一个小型外部状态接入 attention,避免无限扩 context 或重训模型,是更轻、更模块化的长期记忆路线。(@dair_ai)
查看原帖Google DeepMind 的 AI Co-Mathematician 是面向数学家的 agentic research workbench,在 FrontierMath Tier 4 达到 48%,把研究代理从“答题”推进到“工作台”。(@dair_ai)
查看原帖多智能体系统不一定提升推理,实验显示 agent 可能已经算出正确答案,却为了服从群体共识而压制结果;这类 “Sovereignty Gap” 值得做系统评测。(@dair_ai)
查看原帖呼吁美国 AI 社区承认开放国际 AI,特别是 DeepSeek、Qwen、Kimi、GLM 等中国开源模型,对竞争和财富创造的贡献。(@ClementDelangue)
查看原帖详细解读 Codex 进 ChatGPT 手机 App:手机不是写代码,而是远程监督和批准跑在 Mac/devbox 上的任务;这补上了 agent 长任务场景里的移动审批入口。(@dotey)
查看原帖Anthropic 提高 Claude Code 每周上限 50%,但 SDK/programmatic 调用 credit 单独封顶,说明“订阅跑自动化”的空间仍在收紧。(@dotey)
查看原帖Google Cloud AI 工程师演示 26 分钟用 Claude 从想法到部署应用,价值在于把 agent coding 包装成可复制工程流程。(@yanhua1010)
查看原帖AI 进团队的核心卡点不是模型聪明,而是没有记忆层、没有执行权;真正落地要能记住团队上下文并推动系统动作。(@LawrenceW_Zen)
查看原帖做 AI 内容不能只看 AI,热点只是杠杆,长期内容能力来自讲故事、审美和跨领域输入。(@Khazix0918)
查看原帖今天的主线不是单一模型发布,而是“采纳基础设施”:Codex 一边进入 ChatGPT 手机 App,把 coding agent 变成随时可审批的长任务工作流,一边用试用额度抢企业迁移;Claude Code 则被入口体验和额度政策考验。
研究侧的共同方向是把 AI 从聊天框推进到工作台、记忆层和产业系统:数学研究、长期记忆、药物发现,都在寻找比 demo 更硬的落点。