01从代码补全API到能操作整台电脑,Codex这次瞄准的是Claude Code
2021年Codex只是代码补全接口。它后来成了GitHub Copilot背后的引擎。四年过去,形态完全变了。全新的macOS桌面应用能接管鼠标键盘操作电脑、内置浏览器、生成图像、记住过去的项目、支持插件扩展。Windows版同步登场。
这份更新清单看起来像是把一个编码助手升级成了全栈开发agent。The Verge给出了更直接的判断。这是冲着Claude Code来的。
过去一年Claude Code在开发者社区势头很猛。Anthropic靠一个命令行工具加上强悍的编码能力拿下了大量严肃开发者。这次更新几乎把对手能做的每件事都做了一遍:agent执行长任务、跨工具协作、读本地文件和浏览器内容、跨会话保留上下文。
对开发者来说,选择题变了。过去在两个工具间选,主要看模型的编码能力和命令行体验。现在两边都是完整的桌面agent,都能操作电脑、记历史、装插件。模型能力之外,迁移成本、订阅价格、插件生态开始进入决策。
OpenAI这次没发新模型,发的是产品形态。对手过去一年建立起来的桌面agent能力,这一版几乎全部复制。
02Simon Willison的鹈鹕测试里,Qwen3.6-35B画赢了当周发布的Opus 4.7
Simon Willison两年多做一个评测:每个新模型出来,让它画一张骑自行车的鹈鹕SVG。上周赢的那张车把上画了两只爪子,来自他笔记本上的Qwen3.6-35B-A3B。输的那张只画了一只爪子,来自当周发布的Opus 4.7。开源本地模型赢当周云端旗舰,在他的评测历史里是头一次。
同一周阿里完整开放了Qwen3.6-35B-A3B的权重,主打agentic coding能力,能自己调工具链完成多步编码任务。3B激活参数的MoE结构意味着内存够的笔记本就能跑,这种能力过去基本锁在云端服务后面。
一篇叫「本地LLM生态不需要Ollama」的博客本周拿了593点HN票。Ollama过去两年是本地模型的主流入口,作者认为它已经成了性能瓶颈,推荐llama.cpp、LM Studio这类更底层的工具。
0313小时被刷走5.4万欧元,Firebase浏览器密钥默认不限流直通Gemini
一位开发者在Google开发者论坛贴出账单。Firebase给前端生成的浏览器密钥默认不加限制。一旦被盯上,13小时就能跑出5.4万欧元的Gemini调用。帖子转到Hacker News拿到373分、271条评论,回帖里一堆人说自己也差点踩进去。
问题出在默认配置。Firebase的浏览器密钥按官方文档本来就「可公开」。开发者拿它调Gemini时,平台不默认限速或限额。滥用者从前端扒出密钥就能刷账单,用户发现时已是五位数欧元。
OpenAI这一周的动作在另一头。一批头部安全公司加入它的Trusted Access for Cyber计划。合作伙伴用上定制的GPT-5.4-Cyber模型,共享1000万美元的调用额度。
企业客户拿到定制模型和专属额度,个人开发者拿到一张没有限流的浏览器密钥。Google至今没回应那则账单纠纷。

OpenAI发布GPT-Rosalind,瞄准生命科学研究 这是一款面向药物发现、基因组分析和蛋白质推理的前沿推理模型,定位为科研工作流加速器。 openai.com
Physical Intelligence推出π0.7机器人大脑 这家机器人创业公司称π0.7能处理从未被训练过的任务,是通用机器人大脑方向上的早期实质性进展。 techcrunch.com
Anthropic发布Claude Opus 4.7 官方称相比4.6在复杂软件工程任务、图像分析和指令遵循上均有提升,是目前最强的通用可用模型。 theverge.com
Anthropic CPO退出Figma董事会,或推出竞品设计工具 Krieger的退出让「SaaSpocalypse」叙事再添一例——大型AI实验室正逐步蚕食各类软件业务。 techcrunch.com
企业AI编程公司Factory估值冲到15亿美元 成立三年的Factory由Khosla Ventures领投,完成1.5亿美元融资。 techcrunch.com
Q1美国零售网站AI流量暴涨393% Adobe数据显示3月AI流量同比涨269%,且AI来源访客的转化率和客单价均高于非AI访客。 techcrunch.com
Canva的AI助手接入工具调用,能直接生成可编辑设计 用户输入文字提示即可得到可编辑的完整设计稿,助手会自行调用各类工具完成任务。 techcrunch.com
Roblox AI助手上线agentic工具,覆盖游戏开发全流程 新工具支持创作者从规划、构建到测试游戏的整个开发过程。 techcrunch.com
DeepL从文本翻译切入语音翻译 DeepL称该技术可用于Zoom、Microsoft Teams等会议工具的实时翻译。 techcrunch.com
Runway CEO称AI能让好莱坞用1亿美元拍50部电影而不是1部 Runway的CEO押注用数量换爆款概率,反对传统高成本大片模式。 techcrunch.com
Antioch融资850万美元,做物理AI领域的Cursor 这家模拟工具startup为新一代机器人开发者提供仿真环境,完成种子轮融资。 techcrunch.com
InsightFinder融资1500万美元,专攻AI agent故障诊断 CEO Helen Gu称当前行业难题不只是诊断模型本身出错,而是诊断AI嵌入后整个技术栈的运行方式。 techcrunch.com