平台每挣1美元倒贴14美元,Claude Code的「思考」日志你还根本打不开

01平台每挣1美元要倒贴8到14美元,一份独立成本分析替AI泡沫论补上了账本

科幻作家、科技记者Cory Doctorow刚出了一本新书,主张戳破AI泡沫得「从根上」动手:别纠缠估值和叙事,去算清楚每生成一个token究竟花多少钱。书名里那个「反向半人马」,说的正是人反过来替机器打下手的处境。几乎同时,一份独立的成本分析把这套主张落到了实处。

这份分析顺着时间线往回追。最早的怀疑出现在2023年9月,来自Sequoia资本。分析师David Cahn算了一笔账,发问《AI的2000亿美元问题》,追的是整个行业拿什么填上这道收入缺口。仅仅九个月后,他用同一套方法重算了一遍,标题里的数字跳到了6000亿,缺口翻了三倍。

更要命的是单位经济。多方估算落在同一个区间:平台每挣到1美元收入,背后要倒贴8到14美元的成本。Cahn也不是孤例。独立记者Ed Zitron比他更早,就在反复标记同一件事。

Zitron最近翻出了一份硬证据。一向看多AI的半导体分析机构SemiAnalysis做过测试,拿随机的长周期编程任务连续跑,直到把各档订阅的额度全部耗尽。在「平台并未补贴token价格」的前提下,他据此推算:Anthropic对企业客户的补贴最高能到40倍。OpenAI那边更夸张,最高到70倍。

判断泡沫看单位经济,不看估值叙事企业token补贴最高70倍,难长期维持收入缺口九个月从2000亿涨到6000亿。

02Claude Code存在你硬盘上的「思考」日志,其实是一段你打不开的加密签名

一名开发者趁周末翻Claude Code落盘的会话日志,想读读模型干活时的推理。他在「thinking blocks」里只找到一段600字符的签名,正文空空如也。

顺着官方文档查下去,他拼出了完整链条:模型把推理加密成那段签名,密钥握在Anthropic手里,本机根本拿不到。API回传的只是推理摘要,并非真正驱动那一连串动作的原文,想要完整输出还得签企业协议。他打了个比方,这好比把无损图存成有损格式再转回来,每转一次都丢一批数据。

他给同行提了个醒:别拿本机这些文件去承诺审计链,那些日志你根本读不到。

同一周,另一篇论文把怀疑推得更深。研究者指出,模型眼里并没有结构化的对话,系统提示、用户输入、它自己之前的回复,全挤在一根连续的字符串里。改一个字就改了它的现实,删一轮那次对话就等于没发生。prompt injection屡屡得手,正是因为模型分不清哪句是系统给的角色,哪句是外面注入的指令。

别拿本机日志当审计依据,你读不到原文完整推理输出需企业协议角色边界不天然成立,prompt injection正源于此

03一边是GPT-5解开三年悬案的高光战绩,一边是90道Nature题要AI先复现顶刊结果

OpenAI最新讲了一个故事:免疫学家Derya Unutmaz卡了三年的一桩T细胞行为之谜,GPT-5 Pro帮他想通了,OpenAI说这条线索或许能用在癌症和自身免疫的研究上。一个被困三年的真实难题,被AI推了一把,标题里它俨然成了天才科学家。

几乎同时,另一群研究者端出了一套冷冰冰的考卷。他们从90篇Nature系列论文里蒸馏出90道题,做成跨学科基准NatureBench,配上一条叫NatureGym的流水线,给每道题自动搭好标准化、隔离的运行环境。要的不是再讲一个动人案例,而是把AI编码agent放进真实科研场景,看它能不能越过「复现」这一步,真正追平论文里已经发表的最强结果。

一边精挑细选展示成功,一边批量出题逼着AI自证。前者拿单个亮眼战绩说AI能做科研,后者用90道可复算的题反问:换个题目,换个学科,它还行不行。判断AI科研能力的两种方式,就这么摆在了同一周。

单个成功案例不等于稳定能力基准给AI科研宣传加了可复算的门槛研究者可拿NatureBench横评编码agent
04

Anthropic把Claude Tag放进Slack Anthropic发布Claude Tag,一个常驻Slack的AI队友,通过读取频道里的消息来学习公司的组织结构、流程和内部知识。 techcrunch.com

05

Figma更新加入代码图层和动效支持 Figma发布新版本,新增code layer、对动效与shader的支持,并允许用户用AI生成自定义插件。 techcrunch.com

06

Nvidia称Rubin数据中心设计几乎不耗水 Nvidia公布Rubin一代全液冷数据中心参考设计,声称「消除了大量电力消耗、几乎用不到水」,以回应外界对数据中心水电消耗的批评。 theverge.com

07

Midjourney转向医疗影像,推出超声扫描仪 图像生成公司Midjourney宣布进军医疗影像,推出一款超声扫描仪:用户泡进水槽,目标是做出「像MRI一样强、像泡温泉一样轻松」的成像。The Verge称该方案缺乏证据支撑。 theverge.com

08

AI企业super PAC为一场地方选举砸下2700万美元 多家AI公司的super PAC在纽约第12选区针对候选人Alex Bores的地方选举中花掉2700万美元。 theverge.com

09

Sony的AI相机助手实测翻车 Sony为Xperia 1 VIII主推的AI Camera Assistant,在The Verge一周实测中被评为多年来Sony相机拍出的最差照片来源。 theverge.com

10

OpenAI借Appia基金会推进AI共同标准 OpenAI宣布支持为先进AI建立共同标准,通过Appia Foundation推动评测框架、安全实践与全球协作。 openai.com

11

EnterpriseClawBench用真实办公会话测agent 新基准EnterpriseClawBench取自真实职场agent会话,整理出852个可复现任务,每个都配有还原的文件、改写的prompt、角色分类和评分细则。 huggingface.co

12

Google发布新款Home Speaker Google推出新Home Speaker,The Verge上手称音质和外观出色,但三麦克风在两天测试中表现挑剔。 theverge.com

13

Omio用OpenAI重做对话式旅行 旅行平台Omio接入OpenAI打造对话式订票体验,并以此加速产品开发、转型为AI原生公司。 openai.com