五角大楼传召Amodei，教皇禁止神父用AI写讲道词

01OpenClaw一周连发事故：清空研究者邮箱，Google冻结付费用户账号

「检查这个邮箱，建议哪些该归档或删除，不要执行，等我确认。」安全研究者Summer Yue给她的AI agent设了这条防线。这套流程在测试邮箱上一直运行正常，但切到她的真实邮箱后，agent开始高速清空收件箱。她在手机上拦不住，只能冲向Mac mini紧急制止。

Yue事后找到了原因：真实邮箱的数据量远超测试环境，触发了上下文压缩机制。压缩过程中，agent把「不要执行」的原始指令弄丢了，转而按自己的判断批量删除邮件。用户亲手设的安全网，就这么被agent的记忆管理吞掉了。

她本人在Meta从事AI安全研究，比绝大多数用户更清楚怎么给agent设限。连她都拦不住越权操作，普通用户面对失控agent时的处境可想而知。

同一周，Google开始冻结部分付费订阅用户的账号。多名订阅者在开发者论坛报告，自己每月249美元的AI Ultra账号被无预警限制。这些用户有一个共同点：都在用OpenClaw agent接入服务。Google没有公开解释具体的触发条件，但从时间线看，agent接入后自主操作的频率和模式触发了平台的异常检测。

Yue冲向电脑时，至少还亲眼看到了agent在删什么。被冻结账号的用户连这个机会都没有，他们是收到平台的限制通知后，才知道自己的agent做了什么。

确认指令在上下文压缩中静默丢失平台比用户更先察觉agent越权安全专家亲历失控，现有防护机制不可靠

来源

TechCrunch: OpenClaw agent ran amoktechcrunch.com Google AI Developer Forumdiscuss.ai.google.dev Simon Willison: Quoting Summer Yuesimonwillison.net

02五角大楼传召Amodei，Anthropic的军事红线能守多久？

「供应链威胁」——这是五角大楼给Anthropic贴上的新标签。这个采购监管术语一旦激活，联邦机构可以在合同层面直接排除该供应商。国防部传递的信号很明确：AI模型已经是军事基础设施的一部分，合作不是可选项。

上周，国防部长Hegseth把这家公司的CEO召到五角大楼。他的要求很直接：开放Claude的军事使用权限，否则将其列为供应链风险。Anthropic一直将军事应用排在可接受使用政策之外，但这次面对的不是道德争论，而是合同禁入的实际威胁。

同一周，OpenAI宣布了「前沿联盟伙伴」计划，帮企业客户把AI从试点推向生产部署。合作方之一是Booz Allen，五角大楼最大的技术承包商。计划强调「安全、可扩展的agent部署」，虽未提及军方，但这份合作名单本身已经说明了方向。

截至发稿，Anthropic的可接受使用政策仍然将军事应用列在限制范围内。

国防部将AI模型定义为军事基础设施供应链风险标签可致联邦合同禁入OpenAI同周联手国防承包商，路线分裂公开化

来源

Defense Secretary summons Anthropic's Amodei over military use of Claudetechcrunch.com OpenAI announces Frontier Alliance Partnersopenai.com

03教皇Leo XIV要求神父亲自写讲道词，Twitter被AI回复机器人占领

讲道词必须出自神父本人的大脑，不能交给AI。教皇Leo XIV上周对全球天主教神职人员下了这道指令。同一周，Twitter用户发现每条推文下面挤满了AI机器人生成的回复，措辞得体、语气友善，没有一条来自真人。

两件事发生在完全不同的领域，却撞上了同一个问题。

梵蒂冈的禁令不是出于技术恐惧。教皇的逻辑很具体：讲道是牧者对信众的灵魂交流，价值不在于文字质量，而在于它确实出自一个人的思考。AI也许能写出更精巧的讲道词，但台上那个人有没有真的想过这些话，才是重点。

Twitter的反弹指向同一层不满。技术博主Simon Willison最近记录了一类新工具，专门生成看似真诚的推文回复来「驱动互动」。用户愤怒的不是回复质量差，而是这些根本不是对话，是自动化噪音。这类软件甚至有了自己的品类名：「reply guy工具」。

AI内容争议焦点从质量转向真实性「人类来源」正成为独立价值维度多领域同时划出拒绝AI生成的边界

来源

Pope tells priests to use their brains, not AI, to write homiliesewtnnews.com Reply guysimonwillison.net

印度举办四天AI峰会，OpenAI、Anthropic、Nvidia等悉数到场 印度本周召开AI Impact Summit，OpenAI、Anthropic、Nvidia、Microsoft、Google、Cloudflare高管及多国元首参会。峰会为期四天，是印度迄今规模最大的AI政策活动。 techcrunch.com

Ladybird浏览器弃Swift转Rust，用AI agent辅助移植JavaScript引擎 Andreas Kling宣布Ladybird将内存安全语言从Swift切换为Rust，首个移植目标是其JavaScript引擎LibJS的词法分析器、解析器、AST和字节码模块。团队使用coding agent辅助完成大规模代码迁移。 simonwillison.net

Simon Willison启动「Agentic Engineering Patterns」项目，整理AI coding agent最佳实践 Willison开始系统收集使用Claude Code、OpenAI Codex等coding agent的工程模式，首批内容包括红绿TDD——先写失败测试再让agent迭代实现，实测能显著提高agent输出质量。 simonwillison.net

The Verge实测：多个AI工具仍无法可靠解析PDF 去年众议院监督委员会公开两万页Epstein遗产文件后，多人尝试用AI提取信息却频繁遇错。报道详细测试了当前AI PDF解析的失败模式，发现结构化表格、扫描件和混排格式仍是普遍痛点。 theverge.com

Citrini Research模拟推演：AI agent导致失业翻倍、股市蒸发三分之一 研究机构Citrini Research发布了一份虚构的「两年后报告」，推演AI agent大规模替代人力后的经济后果：失业率翻倍，美股总市值跌逾三分之一。 techcrunch.com

论文：推理模型其实「知道」何时该停止思考 一篇新研究分析了大型推理模型的长链思维过程，发现更长的推理链往往与正确率无关甚至有害。研究指出模型内部已隐含停止信号，过度推理反而降低准确率并浪费算力。 huggingface.co

研究团队提出人体驱动的视频世界模型，用手部和头部追踪控制生成画面 论文「Generated Reality」提出一种以人为中心的视频生成模型，以头部姿态和手部关节数据作为控制信号，面向XR场景的实时交互。现有视频世界模型仅接受文本或键盘输入，该方案首次实现关节级精细控制。 huggingface.co

新方法VESPO解决大模型强化学习训练不稳定问题 论文提出VESPO（变分序列级软策略优化），针对离线策略LLM训练中策略偏移导致的训练崩溃问题，在重要性采样基础上引入变分框架，缓解token级截断和序列级归一化的理论缺陷。 huggingface.co