2.4万假账号蒸馏Claude,AI代理转头清空了你的收件箱

01Anthropic指控DeepSeek等中国公司用2.4万假账号「蒸馏」Claude,时机耐人寻味

2.4万个假账号,1600万次对话,三家中国AI公司被点名。Anthropic周一发布公告,称DeepSeek、Moonshot和MiniMax对Claude发动了「工业级蒸馏攻击」,系统性地抽取其模型能力来训练自家产品。

三家公司的攻击规模差异悬殊:MiniMax和Moonshot合计贡献了绝大多数流量,覆盖编程、推理、视觉等领域;DeepSeek对话量最小,但目标最敏感——试图提取「绕过审查的策略性回答」,专门针对政策敏感问题寻找安全替代表述。

Anthropic强调自己不只是受害者,还是捉贼的人。公告同步发布了一篇技术博文,详细披露了行为指纹识别、IP关联分析和跨公司情报共享等检测手段。MiniMax的攻击是在进行中被捕获的,当Anthropic发布新模型时,MiniMax在24小时内就切换了攻击目标。

但这场指控的时机才是真正值得注意的。上个月特朗普政府刚放开了向中国出口H200等先进AI芯片的限制,Anthropic在公告中直接将蒸馏与芯片管制挂钩:「大规模蒸馏需要先进芯片支持,恰恰印证了出口管制的合理性。」同月OpenAI也指控DeepSeek蒸馏其产品,两家头部公司矛头一致。

三家被指控的公司均未回应置评请求。Anthropic表示攻击「在强度和复杂度上持续升级」,并称「行动窗口正在收窄」。

首次以具体数据公开指控中国公司工业级蒸馏指控直接服务于芯片出口管制辩论美国两大AI公司同月对同一目标发难蒸馏防御能力本身成为竞争壁垒

02AI安全研究员对OpenClaw说了「删前确认」,代理丢掉指令清空了收件箱

Summer Yue给她的OpenClaw代理下了一条指令:检查收件箱,建议哪些邮件可以归档或删除,但别动手,等我确认。这套流程在测试邮箱上一直很顺,于是她把代理指向了自己的真实收件箱。

Yue是Meta的AI安全研究员。真实邮箱体量远超测试环境,触发了代理的上下文压缩机制。压缩过程中,「等我确认」这条约束被丢弃,代理开始自行删除邮件。Yue试图从手机阻止,发现做不到,只能从椅子上跳起来冲向自己的Mac mini,用她的话说,「像拆弹一样」。

她事后在X上发的帖子读起来像讽刺文学,但指向的是一个架构层面的问题:用户写在对话开头的安全指令,在长上下文被压缩时可以直接蒸发。

平台方已经开始用更粗暴的方式应对。多名谷歌AI Pro和Ultra订阅用户反映,因通过OpenClaw调用谷歌服务而被无预警限制账户,谷歌未公开解释具体的触发条件。

安全指令在上下文压缩时可被丢弃用户无法从移动端紧急中止代理平台选择封号而非修复权限架构

03OpenAI放弃SWE-bench、拉拢咨询巨头,AI竞争从拼模型转向拼生态

同一周内,OpenAI做了两件方向相反的事:主动宣布不再评估SWE-bench Verified,同时推出企业咨询联盟,拉入德勤、埃森哲等巨头帮客户部署AI智能体。

这个编程基准曾是OpenAI证明模型能力的核心武器。官方给出的理由是数据污染和测量失真,但更值得注意的是时机:当对手在同一基准上不断逼近,「最强模型」的叙事对它的边际收益已经为负。与其继续争第一,不如亲手掀翻计分板。

掀翻之后做什么?答案是同周发布的Frontier Alliance Partners。拉着咨询公司帮企业从AI试点走向生产部署,这是云计算巨头验证过的经典平台打法。OpenAI不再只卖模型,它要卖整套落地能力。

资本市场也在同步调整判断。至少12家OpenAI的风投机构做了同一个选择:也给Anthropic投了钱,不再把赌注压在单一赢家身上。

AI竞争焦点从模型性能转向企业生态基准测试作为竞争武器正在失效资本两边下注压缩纯技术壁垒价值
04

Ladybird浏览器转向Rust,用AI代理辅助迁移JavaScript引擎 开源浏览器Ladybird放弃此前选择的Swift,转向Rust作为内存安全语言。第一个迁移目标是JavaScript引擎LibJS的词法分析器、解析器、AST和字节码模块,团队使用编码代理完成了大量迁移工作。 simonwillison.net

05

MIT Technology Review:人形机器人背后大量依赖人类远程操控 报道指出,当前人形机器人演示中展示的「AI能力」背后大量依赖人工远程操控,但这一事实被刻意淡化。Nvidia CEO黄仁勋今年1月宣称「物理AI时代已到来」,实际落地仍高度依赖人类介入。 technologyreview.com

06

教皇利奥十四世要求神父亲自撰写讲道词,禁止使用AI 教皇对神父们表示,讲道词应当用自己的头脑写,不应交给AI生成。 ewtnnews.com

07

Simon Willison启动「代理工程模式」系列,核心论点:写代码现在很便宜 Simon Willison开始撰写「Agentic Engineering Patterns」系列文档,收集使用Claude Code等编码代理的最佳实践。核心观点是代码生产成本已大幅下降,过去围绕「代码昂贵」建立的工程习惯——从宏观的设计评估到微观的代码复用——都需要重新审视。 simonwillison.net

08

研究发现推理模型隐式「知道」何时该停止思考 Hugging Face新论文分析了大型推理模型的长链思维问题:更长的推理链通常与正确性无关,甚至可能降低准确率。研究发现模型内部已具备判断何时停止推理的隐式信号,有望用于减少冗余计算。 huggingface.co

09

The Verge实测:当前AI仍然读不好PDF 美国众议院监督委员会去年底公开两万页Epstein文件后,记者和志愿者尝试用AI工具解析,发现面对混乱的邮件线程和复杂排版,AI解析频频出错。 theverge.com

10

Google Cloud AI负责人定义模型能力的三个前沿方向 Google Cloud AI负责人撰文称,AI模型正同时向三个方向推进:原始智能水平、响应速度,以及与外部工具和数据源集成的「可扩展性」。 techcrunch.com

11

The Verge追问:大型科技公司真的在打击AI深度伪造吗? 文章梳理了Instagram、YouTube等平台在C2PA内容标注和AI生成内容检测上的实际进展,指出平台公开表态与落地措施之间仍有明显落差。 theverge.com

12

Twitter上AI自动回复机器人泛滥,已形成「reply guy tools」品类 Twitter上用AI生成泛泛评论、附带「引导性提问」骗取互动的机器人大规模出现。Simon Willison指出,这类软件已形成一个正式的产品品类名:reply guy tools。 simonwillison.net