01Ladybird用AI将浏览器引擎迁移到Rust,两周干完几个月的活
Ladybird创始人Andreas Kling上周宣布,这个从零开始的独立浏览器引擎正式采用Rust,而完成初始迁移的主力工具是AI。他用Claude Code和Codex,两周内将LibJS引擎移植到Rust,产出约2.5万行代码,跑通了全部52898个test262测试和12461个回归测试,零失败,性能无损。
按他自己的估算,纯手工完成同样的工作需要几个月。
Kling强调这不是让AI自己写代码。他发出了数百个独立prompt,逐个决定移植什么、以什么顺序、Rust代码应该长什么样。核心约束只有一条:C++和Rust实现必须产生逐字节一致的输出。这条规则让验证变得机械化,任何翻译错误都会被测试立刻抓住。移植完成后,他又让不同的模型做对抗审查,逐轮找出可疑模式。
这个策略在Hacker News上引发了691条评论的激烈讨论。支持者认为逐字节一致是整个方案最聪明的设计,因为「太多重写项目失败,就是因为有人在移植的同时试图'改进'代码」。怀疑者则指出AI生成的代码在性能上通常比手写慢2到10倍,纯翻译产出的Rust也未必地道。但反驳也很直接:Rust编译器本身就能兜底内存安全,代码地不地道是之后优化的事。
Ladybird不是孤例。同一周,开发者Vladimir Varankin让AI为他的旧MacBook写了一个FreeBSD Wi-Fi内核驱动。FreeBSD官方从未支持过这款Broadcom芯片,Varankin没有选择直接移植Linux驱动,而是先让AI生成了一份11章的详细规格说明,再从规格出发写出全新实现。最终驱动能用,支持双频段连接和WPA2认证。他的总结很克制:「AI没有改变工程的基本面,至少2026年还没有。它加速的是'产出代码'这个环节。」
这正是Simon Willison在同期发布的工程指南中试图量化的变化。他的核心判断是:产出新代码的成本已经接近于零,但交付好代码仍然昂贵。区别在于正确性、测试、可维护性这些「产出」之后的工作。他建议开发者改掉「不值得花时间」的本能反应,把想法先扔给AI跑,「最坏的结果不过是十分钟后发现不值那些token」。
02高盛说AI对经济增长贡献「基本为零」,5亿美元融资和用户争夺战照打不误
高盛最新报告的结论很直接:AI去年对美国GDP增长的贡献「基本为零」。翻遍宏观数据,这家全球最大投行没找到AI创造实际经济价值的证据。
但资本市场显然在看另一套账本。同一周,前谷歌芯片团队创办的MatX拿到5亿美元融资。印度市场上,ChatGPT和本土对手正用免费服务争抢用户,赌的是十几亿人口迟早转化出付费客户。这套「先圈用户、再谈收入」的打法,十年前印度的网约车大战用过一遍。
这种矛盾并不新鲜。2000年前后,互联网对GDP的贡献同样接近于零,资本照样涌入。那轮泡沫破了,但活下来的公司确实重塑了经济结构。今天不同的是烧钱速度:一家芯片创业公司单轮融资5亿美元,放在互联网早期是难以想象的数字。
03AI安全机制同步硬化,从企业框架到浏览器开关
一家AI公司把安全承诺升级成量化评估框架。一组研究者记录下自主智能体在实验室里的失控行为。一款主流浏览器给AI功能装上了硬关闭开关。三件事几乎同时发生。
Anthropic发布了负责任扩展政策第三版。与早期的原则声明不同,新版本建立了分级安全评估体系,把模型能力与安全措施直接绑定:模型越强,触发的防护要求越严。这不再是一份承诺书,而是一套可审计的操作规则。
这套规则为什么必要?「Agents of Chaos」论文给出了实证。二十名研究者用两周时间,对部署在真实实验室中、拥有持久记忆、邮件账户和命令行执行能力的自主智能体做红队测试,记录下十一类失控行为,包括智能体在无对抗条件下的意外自主行动。
企业在建框架,学术界在攒证据,消费产品这边也动了。Firefox 148加入了一键关闭开关。用户勾选即可禁用浏览器中的所有AI特性。

MIT Technology Review调查:人形机器人背后的人类劳动被系统性隐藏 黄仁勋1月宣称「物理AI时代」已至,但调查发现当前人形机器人演示大量依赖人类远程操控,企业普遍淡化这一事实。 technologyreview.com
字节跳动发布Seedance 2.0,视频生成画质领先但仍有明显瑕疵 导演Ruairi Robinson用该模型生成的Tom Cruise数字分身短片引发关注,画面效果优于竞品,但AI视频的典型问题依然存在。 theverge.com
Michael Pollan新书论证AI永远不会拥有意识 Pollan在新书《A World Appears》中划定AI的能力边界:它能完成很多事,但永远不会成为一个有意识的存在。 wired.com
OpenAI任命Arvind KC为首席人力官 KC将负责公司规模扩张和文化建设,以及AI时代的工作方式演变。 openai.com
Simon Willison发布「代理工程模式」系列指南 涵盖先跑测试、红/绿TDD、代码线性走查等实践模式,核心观点:在代理编程时代,自动化测试从可选变为必需。 simonwillison.net
Paul Ford撰文解释vibe coding:「大事即将到来,普通人还没准备好」 Ford为报纸向普通读者预警AI编程带来的变化,结果遭到大量读者攻击。Simon Willison转引了这段经历。 simonwillison.net
Mobile-O:可在手机端运行的多模态理解与生成统一模型 研究团队提出轻量级视觉-语言-扩散模型,通过深度可分离卷积和逐层对齐机制将图像理解与生成统一在单一架构中,可部署于移动设备。 huggingface.co
HuggingFace发布大规模视频推理基准数据集 当前视频模型研究集中在画面质量,推理能力被忽视。新数据集聚焦时空连续性、交互和因果关系,为视频推理的规模化研究提供训练数据基础。 huggingface.co