平台每挣1美元倒贴14美元，Claude Code的「思考」日志你还根本打不开

01平台每挣1美元要倒贴8到14美元，一份独立成本分析替AI泡沫论补上了账本

科幻作家、科技记者Cory Doctorow刚出了一本新书，主张戳破AI泡沫得「从根上」动手：别纠缠估值和叙事，去算清楚每生成一个token究竟花多少钱。书名里那个「反向半人马」，说的正是人反过来替机器打下手的处境。几乎同时，一份独立的成本分析把这套主张落到了实处。

这份分析顺着时间线往回追。最早的怀疑出现在2023年9月，来自Sequoia资本。分析师David Cahn算了一笔账，发问《AI的2000亿美元问题》，追的是整个行业拿什么填上这道收入缺口。仅仅九个月后，他用同一套方法重算了一遍，标题里的数字跳到了6000亿，缺口翻了三倍。

更要命的是单位经济。多方估算落在同一个区间：平台每挣到1美元收入，背后要倒贴8到14美元的成本。Cahn也不是孤例。独立记者Ed Zitron比他更早，就在反复标记同一件事。

Zitron最近翻出了一份硬证据。一向看多AI的半导体分析机构SemiAnalysis做过测试，拿随机的长周期编程任务连续跑，直到把各档订阅的额度全部耗尽。在「平台并未补贴token价格」的前提下，他据此推算：Anthropic对企业客户的补贴最高能到40倍。OpenAI那边更夸张，最高到70倍。

判断泡沫看单位经济，不看估值叙事企业token补贴最高70倍，难长期维持收入缺口九个月从2000亿涨到6000亿。

来源

How to burst the AI bubble: Strike at its rootsarstechnica.com AI's Affordability Crisisblog.dshr.org

02Claude Code存在你硬盘上的「思考」日志，其实是一段你打不开的加密签名

一名开发者趁周末翻Claude Code落盘的会话日志，想读读模型干活时的推理。他在「thinking blocks」里只找到一段600字符的签名，正文空空如也。

顺着官方文档查下去，他拼出了完整链条：模型把推理加密成那段签名，密钥握在Anthropic手里，本机根本拿不到。API回传的只是推理摘要，并非真正驱动那一连串动作的原文，想要完整输出还得签企业协议。他打了个比方，这好比把无损图存成有损格式再转回来，每转一次都丢一批数据。

他给同行提了个醒：别拿本机这些文件去承诺审计链，那些日志你根本读不到。

同一周，另一篇论文把怀疑推得更深。研究者指出，模型眼里并没有结构化的对话，系统提示、用户输入、它自己之前的回复，全挤在一根连续的字符串里。改一个字就改了它的现实，删一轮那次对话就等于没发生。prompt injection屡屡得手，正是因为模型分不清哪句是系统给的角色，哪句是外面注入的指令。

别拿本机日志当审计依据，你读不到原文完整推理输出需企业协议角色边界不天然成立，prompt injection正源于此

来源

The text in Claude Code's "Extended Thinking" outputpatrickmccanna.net Prompt Injection as Role Confusionrole-confusion.github.io

03一边是GPT-5解开三年悬案的高光战绩，一边是90道Nature题要AI先复现顶刊结果

OpenAI最新讲了一个故事：免疫学家Derya Unutmaz卡了三年的一桩T细胞行为之谜，GPT-5 Pro帮他想通了，OpenAI说这条线索或许能用在癌症和自身免疫的研究上。一个被困三年的真实难题，被AI推了一把，标题里它俨然成了天才科学家。

几乎同时，另一群研究者端出了一套冷冰冰的考卷。他们从90篇Nature系列论文里蒸馏出90道题，做成跨学科基准NatureBench，配上一条叫NatureGym的流水线，给每道题自动搭好标准化、隔离的运行环境。要的不是再讲一个动人案例，而是把AI编码agent放进真实科研场景，看它能不能越过「复现」这一步，真正追平论文里已经发表的最强结果。

一边精挑细选展示成功，一边批量出题逼着AI自证。前者拿单个亮眼战绩说AI能做科研，后者用90道可复算的题反问：换个题目，换个学科，它还行不行。判断AI科研能力的两种方式，就这么摆在了同一周。

单个成功案例不等于稳定能力基准给AI科研宣传加了可复算的门槛研究者可拿NatureBench横评编码agent

来源

How GPT-5 helped immunologist Derya Unutmaz solve a 3-year-old mysteryopenai.com NatureBench: Can Coding Agents Match the Published SOTA of Nature-Family Papers?huggingface.co

Anthropic把Claude Tag放进Slack Anthropic发布Claude Tag，一个常驻Slack的AI队友，通过读取频道里的消息来学习公司的组织结构、流程和内部知识。 techcrunch.com

Figma更新加入代码图层和动效支持 Figma发布新版本，新增code layer、对动效与shader的支持，并允许用户用AI生成自定义插件。 techcrunch.com

Nvidia称Rubin数据中心设计几乎不耗水 Nvidia公布Rubin一代全液冷数据中心参考设计，声称「消除了大量电力消耗、几乎用不到水」，以回应外界对数据中心水电消耗的批评。 theverge.com

Midjourney转向医疗影像，推出超声扫描仪 图像生成公司Midjourney宣布进军医疗影像，推出一款超声扫描仪：用户泡进水槽，目标是做出「像MRI一样强、像泡温泉一样轻松」的成像。The Verge称该方案缺乏证据支撑。 theverge.com

AI企业super PAC为一场地方选举砸下2700万美元 多家AI公司的super PAC在纽约第12选区针对候选人Alex Bores的地方选举中花掉2700万美元。 theverge.com

Sony的AI相机助手实测翻车 Sony为Xperia 1 VIII主推的AI Camera Assistant，在The Verge一周实测中被评为多年来Sony相机拍出的最差照片来源。 theverge.com

OpenAI借Appia基金会推进AI共同标准 OpenAI宣布支持为先进AI建立共同标准，通过Appia Foundation推动评测框架、安全实践与全球协作。 openai.com

EnterpriseClawBench用真实办公会话测agent 新基准EnterpriseClawBench取自真实职场agent会话，整理出852个可复现任务，每个都配有还原的文件、改写的prompt、角色分类和评分细则。 huggingface.co

Google发布新款Home Speaker Google推出新Home Speaker，The Verge上手称音质和外观出色，但三麦克风在两天测试中表现挑剔。 theverge.com

Omio用OpenAI重做对话式旅行 旅行平台Omio接入OpenAI打造对话式订票体验，并以此加速产品开发、转型为AI原生公司。 openai.com