Codex瞄准Claude Code,开源小模型画赢Opus 4.7

01从代码补全API到能操作整台电脑,Codex这次瞄准的是Claude Code

2021年Codex只是代码补全接口。它后来成了GitHub Copilot背后的引擎。四年过去,形态完全变了。全新的macOS桌面应用能接管鼠标键盘操作电脑、内置浏览器、生成图像、记住过去的项目、支持插件扩展。Windows版同步登场。

这份更新清单看起来像是把一个编码助手升级成了全栈开发agent。The Verge给出了更直接的判断。这是冲着Claude Code来的。

过去一年Claude Code在开发者社区势头很猛。Anthropic靠一个命令行工具加上强悍的编码能力拿下了大量严肃开发者。这次更新几乎把对手能做的每件事都做了一遍:agent执行长任务、跨工具协作、读本地文件和浏览器内容、跨会话保留上下文。

对开发者来说,选择题变了。过去在两个工具间选,主要看模型的编码能力和命令行体验。现在两边都是完整的桌面agent,都能操作电脑、记历史、装插件。模型能力之外,迁移成本、订阅价格、插件生态开始进入决策。

OpenAI这次没发新模型,发的是产品形态。对手过去一年建立起来的桌面agent能力,这一版几乎全部复制。

开发者选工具不再只看模型能力,生态开始主导Claude Code命令行优势被桌面agent形态稀释coding agent赛道进入功能对等期

02Simon Willison的鹈鹕测试里,Qwen3.6-35B画赢了当周发布的Opus 4.7

Simon Willison两年多做一个评测:每个新模型出来,让它画一张骑自行车的鹈鹕SVG。上周赢的那张车把上画了两只爪子,来自他笔记本上的Qwen3.6-35B-A3B。输的那张只画了一只爪子,来自当周发布的Opus 4.7。开源本地模型赢当周云端旗舰,在他的评测历史里是头一次。

同一周阿里完整开放了Qwen3.6-35B-A3B的权重,主打agentic coding能力,能自己调工具链完成多步编码任务。3B激活参数的MoE结构意味着内存够的笔记本就能跑,这种能力过去基本锁在云端服务后面。

一篇叫「本地LLM生态不需要Ollama」的博客本周拿了593点HN票。Ollama过去两年是本地模型的主流入口,作者认为它已经成了性能瓶颈,推荐llama.cpp、LM Studio这类更底层的工具。

跑agentic coding不再只能走付费API推理成本从按token转向一次性硬件投入开发者开始抛弃Ollama换llama.cpp

0313小时被刷走5.4万欧元,Firebase浏览器密钥默认不限流直通Gemini

一位开发者在Google开发者论坛贴出账单。Firebase给前端生成的浏览器密钥默认不加限制。一旦被盯上,13小时就能跑出5.4万欧元的Gemini调用。帖子转到Hacker News拿到373分、271条评论,回帖里一堆人说自己也差点踩进去。

问题出在默认配置。Firebase的浏览器密钥按官方文档本来就「可公开」。开发者拿它调Gemini时,平台不默认限速或限额。滥用者从前端扒出密钥就能刷账单,用户发现时已是五位数欧元。

OpenAI这一周的动作在另一头。一批头部安全公司加入它的Trusted Access for Cyber计划。合作伙伴用上定制的GPT-5.4-Cyber模型,共享1000万美元的调用额度。

企业客户拿到定制模型和专属额度,个人开发者拿到一张没有限流的浏览器密钥。Google至今没回应那则账单纠纷。

独立开发者是默认配置的首要受害者AI调用计费在前端暴露场景下缺熔断机制企业级安全产品不解决个人账号被刷
04

OpenAI发布GPT-Rosalind,瞄准生命科学研究 这是一款面向药物发现、基因组分析和蛋白质推理的前沿推理模型,定位为科研工作流加速器。 openai.com

05

Physical Intelligence推出π0.7机器人大脑 这家机器人创业公司称π0.7能处理从未被训练过的任务,是通用机器人大脑方向上的早期实质性进展。 techcrunch.com

06

Anthropic发布Claude Opus 4.7 官方称相比4.6在复杂软件工程任务、图像分析和指令遵循上均有提升,是目前最强的通用可用模型。 theverge.com

07

Anthropic CPO退出Figma董事会,或推出竞品设计工具 Krieger的退出让「SaaSpocalypse」叙事再添一例——大型AI实验室正逐步蚕食各类软件业务。 techcrunch.com

08

企业AI编程公司Factory估值冲到15亿美元 成立三年的Factory由Khosla Ventures领投,完成1.5亿美元融资。 techcrunch.com

09

Q1美国零售网站AI流量暴涨393% Adobe数据显示3月AI流量同比涨269%,且AI来源访客的转化率和客单价均高于非AI访客。 techcrunch.com

10

Canva的AI助手接入工具调用,能直接生成可编辑设计 用户输入文字提示即可得到可编辑的完整设计稿,助手会自行调用各类工具完成任务。 techcrunch.com

11

Roblox AI助手上线agentic工具,覆盖游戏开发全流程 新工具支持创作者从规划、构建到测试游戏的整个开发过程。 techcrunch.com

12

DeepL从文本翻译切入语音翻译 DeepL称该技术可用于Zoom、Microsoft Teams等会议工具的实时翻译。 techcrunch.com

13

Runway CEO称AI能让好莱坞用1亿美元拍50部电影而不是1部 Runway的CEO押注用数量换爆款概率,反对传统高成本大片模式。 techcrunch.com

14

Antioch融资850万美元,做物理AI领域的Cursor 这家模拟工具startup为新一代机器人开发者提供仿真环境,完成种子轮融资。 techcrunch.com

15

InsightFinder融资1500万美元,专攻AI agent故障诊断 CEO Helen Gu称当前行业难题不只是诊断模型本身出错,而是诊断AI嵌入后整个技术栈的运行方式。 techcrunch.com