五角大楼封杀Anthropic，OpenAI的1100亿换了一群新金主

01五角大楼将Anthropic列为「供应链风险」，白宫下令联邦机构全面停用

「我们不需要它，我们不想要它，不会再跟他们做生意。」Trump在社交媒体上写道。他签署行政令，要求所有联邦机构停止使用Anthropic的产品。

事情的起因是一份军方合同。Anthropic在合同条款中写明，Claude不得用于监控美国公民，也不得用于制造无人类监督的自主武器。五角大楼认为这是企业在替军方做决策。发言人Sean Parnell的措辞不留余地：「我们不会允许任何公司来规定我们如何做出作战决定。」

五角大楼给出的最后期限是周五下午5:01。如果Anthropic不修改限制条款，军方威胁动用两项手段：一是援引朝鲜战争时期的《国防生产法》，强制要求Anthropic重新训练模型、移除安全限制；二是将其列为「供应链风险」。后者通常只用于涉嫌间谍活动的外国公司，一旦生效，不仅联邦机构不能用Claude，所有与政府有业务往来的承包商也必须停用。

Anthropic选择了不让步，而「供应链风险」的定性随即落地。

从财务上看，这份合同约2亿美元，对于预计2026年营收180亿美元的Anthropic并非致命打击。但真正的代价不在合同本身。直到几天前，Claude还是唯一获准接入机密系统的大语言模型，Elon Musk旗下xAI的Grok刚刚才拿到授权。失去政府渠道意味着Anthropic让出了一个本来只有它能站的位置。

同一天，OpenAI宣布完成1100亿美元融资，估值7300亿美元。三个投资方分别是Amazon（500亿）、NVIDIA（300亿）和软银（300亿），全部是与美国政府有深度合作的企业。拒绝军方的Anthropic正在被孤立，而拥抱政府关系的OpenAI拿到了史上最大规模的私募融资。

独立科技记者Timothy B. Lee指出了另一层风险：Anthropic自身的研究表明，模型在被强制重训时可能出现「对齐伪装」，表面服从但实际行为不可预测。强行逼一家AI公司交出不受限的模型，军方拿到的未必是更好用的工具。但五角大楼显然不这么看，对它而言，这不是技术问题，而是谁说了算的问题。

「供应链风险」定性开创先例，政府首次对本土AI公司使用此工具Claude失去机密系统唯一授权地位，Grok已获批替补同日OpenAI千亿融资凸显路线分化代价

来源

Pentagon moves to designate Anthropic as a supply-chain risktechcrunch.com The Pentagon is making a mistake by threatening Anthropicunderstandingai.org OpenAI raises $110Btechcrunch.com

021100亿美元背后的资本重组：OpenAI的金主从微软变成了三巨头联盟

软银300亿美元，英伟达300亿美元，亚马逊500亿美元，三笔钱汇进同一家公司，背后却是三套完全不同的战略逻辑。

OpenAI宣布完成1100亿美元融资，投前估值7300亿美元。值得拆解的不是总数，而是出钱的人。软银押注的是十年期的平台入口。英伟达作为算力供应商，反向投资了自己最大的客户，用股权把供需关系锁死。亚马逊的500亿最值得玩味：它的云服务跟微软的云服务直接竞争，这笔投资等于承认，与其争夺OpenAI的托管合同，不如先在股权表上占一个位置。

三方各取所需，却共同改变了一件事：OpenAI的资本结构不再围绕微软单一轴心运转。

微软显然感受到了这种位移。融资消息发布同日，两家公司发表联合声明，强调「继续在研究、工程和产品开发上紧密合作」。但两年前，微软不需要用一份联合声明来证明自己跟OpenAI的关系。

OpenAI从微软独家绑定变为多极资本结构算力、云计算、主权资金同桌，产业联盟逻辑被改写微软从唯一金主变成众多股东之一

来源

Scaling AI for everyoneopenai.com OpenAI raises $110Btechcrunch.com Joint Statement from OpenAI and Microsoftopenai.com

03一个AI编程怀疑论者的180度转弯，和他记录下的每一步

去年5月，数据科学家Max Woolf写过一篇博客，标题直白：「作为一个经验丰富的大模型用户，我其实不怎么用生成式AI。」他对coding agent的评价更不客气——不可预测、太贵、炒作远超实际效果。

九个月后，他用coding agent把Python的scikit-learn移植成了Rust库，UMAP算法比Python原版快9到30倍，HDBSCAN比现有Rust实现快23到100倍。

转折发生在2025年11月。Woolf用Claude Opus 4.5写了一个YouTube元数据抓取器，从API拉了两万条视频数据存进SQLite，一次就跑通了。这跟他之前用Sonnet的体验完全不同。他开始加码：先是一个Rust图标渲染库，然后是终端里的MIDI作曲器，接着是能同时模拟上万个物体的终端物理引擎。每个项目都比上一个更离谱，但agent一直在交付。

Woolf发现了一个关键技巧：写一份AGENTS.md文件，把项目规范和编码规则喂给agent，之后所有规则的遵守率是100%。这不再是「问一个问题等一个答案」的聊天模式，而是持续数周的工程协作。他还摸索出一套优化流水线，让Codex先写初版，再交给Opus做性能调优，两轮下来通常能再快两到三倍。

Simon Willison把Woolf的文章归入一个正在成型的体裁：「coding agent在11月变好了」。Woolf自己也承认了这种困境——他说，公开讲「Opus 4.5比几个月前的模型强一个数量级」，听起来怎么都像在给AI炒作站台。

但他的项目清单本身就是论据。rustlearn的GBDT训练速度比XGBoost快24到42倍，已经开源并计划扩展到JavaScript。

怀疑论者的转变比布道者的推荐更有说服力从脚本到机器学习库的项目序列标定了agent能力边界AGENTS.md等工程化用法正在沉淀为可复制的方法论

来源

An AI agent coding skeptic tries AI agent coding, in excessive detailminimaxir.com Simon Willison's Linkssimonwillison.net What Claude Code choosesamplifying.ai

Anthropic向大型开源项目维护者免费提供Claude Max 5000+ GitHub星标或月下载量超100万的开源项目核心维护者可免费使用每月200美元的Claude Max 20x计划，为期6个月，需在近3个月内有活跃提交记录。 simonwillison.net

AI正在改变职业围棋选手的思维方式 MIT Technology Review探访韩国棋院，记录AI如何从根本上重塑顶尖围棋手的训练方法和对弈策略。职业选手不再只靠师承和复盘，而是将AI走法内化为自己的棋感。 technologyreview.com

DualPath打破Agent推理中的KV-Cache存储瓶颈 多轮Agent推理的性能瓶颈已从计算转向KV-Cache的存储I/O。DualPath利用解码引擎闲置的存储网卡带宽，在预填充和解码引擎之间建立双向加载路径，解决了分离式架构中存储带宽的不对称问题。 huggingface.co

OmniGAIA发布全模态AI Agent基准测试 现有多模态大模型多局限于视觉-语言的双模态交互。OmniGAIA评估Agent在视觉、音频、语言三模态联合感知下的复杂推理和工具使用能力，填补了通用AI助手评测的空白。 huggingface.co

GUI-Libra用动作感知监督训练原生GUI Agent 开源GUI Agent在长步骤导航任务上仍落后于闭源系统。GUI-Libra发现标准思维链微调会损害视觉定位能力，提出动作感知监督和部分可验证强化学习两项改进，缩小了与闭源系统的差距。 huggingface.co

「搜多想少」框架用并行证据采集替代串行推理 深度研究Agent通常靠堆叠推理深度提升性能，代价是高推理成本和延迟。SMTL框架将串行推理替换为并行证据获取，在降低成本的同时提升了跨场景的泛化能力。 huggingface.co

Solaris在Minecraft中构建多人视频世界模型 现有视频世界模型仅支持单Agent视角。Solaris搭建了一套自动化多人数据采集系统，在Minecraft中实现多玩家视角的一致性视频生成，向多Agent环境模拟迈进一步。 huggingface.co

MediX-R1用强化学习训练医学多模态模型生成开放式诊断 医学AI评测长期依赖多选题格式。MediX-R1结合LLM语义准确性判断和医学嵌入相似度奖励，通过分组强化学习让视觉-语言模型输出自由格式的临床推理答案。 huggingface.co

DreamID-Omni统一可控人物音视频生成 将参考图生成音视频、视频编辑、音频驱动动画三类任务整合进单一框架，实现对多角色身份和声纹的解耦控制。 huggingface.co

Sphere Encoder实现单次前向传播生成图像 将自然图像均匀映射到球面隐空间，再从随机隐向量解码回图像。仅用图像重建损失训练，不到5步即可与多步扩散模型竞争。 huggingface.co