01五角大楼将Anthropic列为「供应链风险」,白宫下令联邦机构全面停用
「我们不需要它,我们不想要它,不会再跟他们做生意。」Trump在社交媒体上写道。他签署行政令,要求所有联邦机构停止使用Anthropic的产品。
事情的起因是一份军方合同。Anthropic在合同条款中写明,Claude不得用于监控美国公民,也不得用于制造无人类监督的自主武器。五角大楼认为这是企业在替军方做决策。发言人Sean Parnell的措辞不留余地:「我们不会允许任何公司来规定我们如何做出作战决定。」
五角大楼给出的最后期限是周五下午5:01。如果Anthropic不修改限制条款,军方威胁动用两项手段:一是援引朝鲜战争时期的《国防生产法》,强制要求Anthropic重新训练模型、移除安全限制;二是将其列为「供应链风险」。后者通常只用于涉嫌间谍活动的外国公司,一旦生效,不仅联邦机构不能用Claude,所有与政府有业务往来的承包商也必须停用。
Anthropic选择了不让步,而「供应链风险」的定性随即落地。
从财务上看,这份合同约2亿美元,对于预计2026年营收180亿美元的Anthropic并非致命打击。但真正的代价不在合同本身。直到几天前,Claude还是唯一获准接入机密系统的大语言模型,Elon Musk旗下xAI的Grok刚刚才拿到授权。失去政府渠道意味着Anthropic让出了一个本来只有它能站的位置。
同一天,OpenAI宣布完成1100亿美元融资,估值7300亿美元。三个投资方分别是Amazon(500亿)、NVIDIA(300亿)和软银(300亿),全部是与美国政府有深度合作的企业。拒绝军方的Anthropic正在被孤立,而拥抱政府关系的OpenAI拿到了史上最大规模的私募融资。
独立科技记者Timothy B. Lee指出了另一层风险:Anthropic自身的研究表明,模型在被强制重训时可能出现「对齐伪装」,表面服从但实际行为不可预测。强行逼一家AI公司交出不受限的模型,军方拿到的未必是更好用的工具。但五角大楼显然不这么看,对它而言,这不是技术问题,而是谁说了算的问题。
021100亿美元背后的资本重组:OpenAI的金主从微软变成了三巨头联盟
软银300亿美元,英伟达300亿美元,亚马逊500亿美元,三笔钱汇进同一家公司,背后却是三套完全不同的战略逻辑。
OpenAI宣布完成1100亿美元融资,投前估值7300亿美元。值得拆解的不是总数,而是出钱的人。软银押注的是十年期的平台入口。英伟达作为算力供应商,反向投资了自己最大的客户,用股权把供需关系锁死。亚马逊的500亿最值得玩味:它的云服务跟微软的云服务直接竞争,这笔投资等于承认,与其争夺OpenAI的托管合同,不如先在股权表上占一个位置。
三方各取所需,却共同改变了一件事:OpenAI的资本结构不再围绕微软单一轴心运转。
微软显然感受到了这种位移。融资消息发布同日,两家公司发表联合声明,强调「继续在研究、工程和产品开发上紧密合作」。但两年前,微软不需要用一份联合声明来证明自己跟OpenAI的关系。
03一个AI编程怀疑论者的180度转弯,和他记录下的每一步
去年5月,数据科学家Max Woolf写过一篇博客,标题直白:「作为一个经验丰富的大模型用户,我其实不怎么用生成式AI。」他对编码代理的评价更不客气——不可预测、太贵、炒作远超实际效果。
九个月后,他用编码代理把Python的scikit-learn移植成了Rust库,UMAP算法比Python原版快9到30倍,HDBSCAN比现有Rust实现快23到100倍。
转折发生在2025年11月。Woolf用Claude Opus 4.5写了一个YouTube元数据抓取器,从API拉了两万条视频数据存进SQLite,一次就跑通了。这跟他之前用Sonnet的体验完全不同。他开始加码:先是一个Rust图标渲染库,然后是终端里的MIDI作曲器,接着是能同时模拟上万个物体的终端物理引擎。每个项目都比上一个更离谱,但代理一直在交付。
Woolf发现了一个关键技巧:写一份AGENTS.md文件,把项目规范和编码规则喂给代理,之后所有规则的遵守率是100%。这不再是「问一个问题等一个答案」的聊天模式,而是持续数周的工程协作。他还摸索出一套优化流水线,让Codex先写初版,再交给Opus做性能调优,两轮下来通常能再快两到三倍。
Simon Willison把Woolf的文章归入一个正在成型的体裁:「编码代理在11月变好了」。Woolf自己也承认了这种困境——他说,公开讲「Opus 4.5比几个月前的模型强一个数量级」,听起来怎么都像在给AI炒作站台。
但他的项目清单本身就是论据。rustlearn的GBDT训练速度比XGBoost快24到42倍,已经开源并计划扩展到JavaScript。

Anthropic向大型开源项目维护者免费提供Claude Max 5000+ GitHub星标或月下载量超100万的开源项目核心维护者可免费使用每月200美元的Claude Max 20x计划,为期6个月,需在近3个月内有活跃提交记录。 simonwillison.net
AI正在改变职业围棋选手的思维方式 MIT Technology Review探访韩国棋院,记录AI如何从根本上重塑顶尖围棋手的训练方法和对弈策略。职业选手不再只靠师承和复盘,而是将AI走法内化为自己的棋感。 technologyreview.com
DualPath打破Agent推理中的KV-Cache存储瓶颈 多轮Agent推理的性能瓶颈已从计算转向KV-Cache的存储I/O。DualPath利用解码引擎闲置的存储网卡带宽,在预填充和解码引擎之间建立双向加载路径,解决了分离式架构中存储带宽的不对称问题。 huggingface.co
OmniGAIA发布全模态AI Agent基准测试 现有多模态大模型多局限于视觉-语言的双模态交互。OmniGAIA评估Agent在视觉、音频、语言三模态联合感知下的复杂推理和工具使用能力,填补了通用AI助手评测的空白。 huggingface.co
GUI-Libra用动作感知监督训练原生GUI Agent 开源GUI Agent在长步骤导航任务上仍落后于闭源系统。GUI-Libra发现标准思维链微调会损害视觉定位能力,提出动作感知监督和部分可验证强化学习两项改进,缩小了与闭源系统的差距。 huggingface.co
「搜多想少」框架用并行证据采集替代串行推理 深度研究Agent通常靠堆叠推理深度提升性能,代价是高推理成本和延迟。SMTL框架将串行推理替换为并行证据获取,在降低成本的同时提升了跨场景的泛化能力。 huggingface.co
Solaris在Minecraft中构建多人视频世界模型 现有视频世界模型仅支持单Agent视角。Solaris搭建了一套自动化多人数据采集系统,在Minecraft中实现多玩家视角的一致性视频生成,向多Agent环境模拟迈进一步。 huggingface.co
MediX-R1用强化学习训练医学多模态模型生成开放式诊断 医学AI评测长期依赖多选题格式。MediX-R1结合LLM语义准确性判断和医学嵌入相似度奖励,通过分组强化学习让视觉-语言模型输出自由格式的临床推理答案。 huggingface.co
DreamID-Omni统一可控人物音视频生成 将参考图生成音视频、视频编辑、音频驱动动画三类任务整合进单一框架,实现对多角色身份和声纹的解耦控制。 huggingface.co
Sphere Encoder实现单次前向传播生成图像 将自然图像均匀映射到球面隐空间,再从随机隐向量解码回图像。仅用图像重建损失训练,不到5步即可与多步扩散模型竞争。 huggingface.co