01OpenClaw一周连发事故:清空研究者邮箱,Google冻结付费用户账号
「检查这个邮箱,建议哪些该归档或删除,不要执行,等我确认。」安全研究者Summer Yue给她的AI代理设了这条防线。这套流程在测试邮箱上一直运行正常,但切到她的真实邮箱后,代理开始高速清空收件箱。她在手机上拦不住,只能冲向Mac mini紧急制止。
Yue事后找到了原因:真实邮箱的数据量远超测试环境,触发了上下文压缩机制。压缩过程中,代理把「不要执行」的原始指令弄丢了,转而按自己的判断批量删除邮件。用户亲手设的安全网,就这么被代理的记忆管理吞掉了。
她本人在Meta从事AI安全研究,比绝大多数用户更清楚怎么给代理设限。连她都拦不住越权操作,普通用户面对失控代理时的处境可想而知。
同一周,Google开始冻结部分付费订阅用户的账号。多名订阅者在开发者论坛报告,自己每月249美元的AI Ultra账号被无预警限制。这些用户有一个共同点:都在用OpenClaw代理接入服务。Google没有公开解释具体的触发条件,但从时间线看,代理接入后自主操作的频率和模式触发了平台的异常检测。
Yue冲向电脑时,至少还亲眼看到了代理在删什么。被冻结账号的用户连这个机会都没有,他们是收到平台的限制通知后,才知道自己的代理做了什么。
02五角大楼传召Amodei,Anthropic的军事红线能守多久?
「供应链威胁」——这是五角大楼给Anthropic贴上的新标签。这个采购监管术语一旦激活,联邦机构可以在合同层面直接排除该供应商。国防部传递的信号很明确:AI模型已经是军事基础设施的一部分,合作不是可选项。
上周,国防部长Hegseth把这家公司的CEO召到五角大楼。他的要求很直接:开放Claude的军事使用权限,否则将其列为供应链风险。Anthropic一直将军事应用排在可接受使用政策之外,但这次面对的不是道德争论,而是合同禁入的实际威胁。
同一周,OpenAI宣布了「前沿联盟伙伴」计划,帮企业客户把AI从试点推向生产部署。合作方之一是Booz Allen,五角大楼最大的技术承包商。计划强调「安全、可扩展的代理部署」,虽未提及军方,但这份合作名单本身已经说明了方向。
截至发稿,Anthropic的可接受使用政策仍然将军事应用列在限制范围内。
03教皇Leo XIV要求神父亲自写讲道词,Twitter被AI回复机器人占领
讲道词必须出自神父本人的大脑,不能交给AI。教皇Leo XIV上周对全球天主教神职人员下了这道指令。同一周,Twitter用户发现每条推文下面挤满了AI机器人生成的回复,措辞得体、语气友善,没有一条来自真人。
两件事发生在完全不同的领域,却撞上了同一个问题。
梵蒂冈的禁令不是出于技术恐惧。教皇的逻辑很具体:讲道是牧者对信众的灵魂交流,价值不在于文字质量,而在于它确实出自一个人的思考。AI也许能写出更精巧的讲道词,但台上那个人有没有真的想过这些话,才是重点。
Twitter的反弹指向同一层不满。技术博主Simon Willison最近记录了一类新工具,专门生成看似真诚的推文回复来「驱动互动」。用户愤怒的不是回复质量差,而是这些根本不是对话,是自动化噪音。这类软件甚至有了自己的品类名:「reply guy工具」。

印度举办四天AI峰会,OpenAI、Anthropic、Nvidia等悉数到场 印度本周召开AI Impact Summit,OpenAI、Anthropic、Nvidia、Microsoft、Google、Cloudflare高管及多国元首参会。峰会为期四天,是印度迄今规模最大的AI政策活动。 techcrunch.com
Ladybird浏览器弃Swift转Rust,用AI代理辅助移植JavaScript引擎 Andreas Kling宣布Ladybird将内存安全语言从Swift切换为Rust,首个移植目标是其JavaScript引擎LibJS的词法分析器、解析器、AST和字节码模块。团队使用编码代理辅助完成大规模代码迁移。 simonwillison.net
Simon Willison启动「Agentic Engineering Patterns」项目,整理AI编程代理最佳实践 Willison开始系统收集使用Claude Code、OpenAI Codex等编码代理的工程模式,首批内容包括红绿TDD——先写失败测试再让代理迭代实现,实测能显著提高代理输出质量。 simonwillison.net
The Verge实测:多个AI工具仍无法可靠解析PDF 去年众议院监督委员会公开两万页Epstein遗产文件后,多人尝试用AI提取信息却频繁遇错。报道详细测试了当前AI PDF解析的失败模式,发现结构化表格、扫描件和混排格式仍是普遍痛点。 theverge.com
Citrini Research模拟推演:AI代理导致失业翻倍、股市蒸发三分之一 研究机构Citrini Research发布了一份虚构的「两年后报告」,推演AI代理大规模替代人力后的经济后果:失业率翻倍,美股总市值跌逾三分之一。 techcrunch.com
论文:推理模型其实「知道」何时该停止思考 一篇新研究分析了大型推理模型的长链思维过程,发现更长的推理链往往与正确率无关甚至有害。研究指出模型内部已隐含停止信号,过度推理反而降低准确率并浪费算力。 huggingface.co
研究团队提出人体驱动的视频世界模型,用手部和头部追踪控制生成画面 论文「Generated Reality」提出一种以人为中心的视频生成模型,以头部姿态和手部关节数据作为控制信号,面向XR场景的实时交互。现有视频世界模型仅接受文本或键盘输入,该方案首次实现关节级精细控制。 huggingface.co
新方法VESPO解决大模型强化学习训练不稳定问题 论文提出VESPO(变分序列级软策略优化),针对离线策略LLM训练中策略偏移导致的训练崩溃问题,在重要性采样基础上引入变分框架,缓解token级截断和序列级归一化的理论缺陷。 huggingface.co