OpenAI每挣1美元要烧掉8到14美元，干脆自己造芯片

01每挣1美元要烧掉8到14美元,OpenAI决定自己造一颗推理芯片

半导体分析机构SemiAnalysis做过一次测试:拿一批耗时很长的编程任务,一直跑到把订阅额度全部撑爆。结论很刺眼:这些AI平台每生成1美元收入,背后要烧掉8到14美元的算力;具体到OpenAI,对企业客户的补贴最高能到70倍。

这笔账的大头压在推理上。训练一个模型是一次性的大投入,推理却是每一次对话、每一行生成的代码都要重新付费,只要用户还在用,钱就一直往外流。而撑起这套系统的芯片,OpenAI一直靠对外采购,性能、成本和供应都捏在别人手里。

本周三,它决定把这根命脉拿回来。OpenAI和博通联手,造出了一颗属于自己的芯片。这颗芯片名叫Jalapeño,定位被反复强调:专为大模型推理优化,而不是训练。

它是一颗ASIC,一种只为单一任务设计的专用芯片,而它的任务就是推理。从买芯片的人,到造芯片的人,OpenAI想用一颗自研的硅片把推理成本压下去。据Verge报道,这是这家公司的第一颗自研处理器,用来支撑当前和未来的大模型运行,官方说目标是同时改善性能、效率和规模。

每1美元收入烧掉8到14美元算力推理是烧钱大头,训练只是一次性投入自研ASIC意在摆脱外购芯片依赖下一步看Jalapeño能否量产落地

来源

OpenAI and Broadcom unveil LLM-optimized inference chipopenai.com OpenAI reveals its first AI processor: Jalapeñotheverge.com

02被白宫官员私下称作「weirdo」后，Anthropic创始人在高层会谈中被Tom Brown顶替

以「安全」立身的Anthropic，正在白宫失去说话的位置。据Wired报道，这家公司在与白宫的高风险会谈中换掉了出席者。过去坐在谈判桌前的是CEO、联合创始人Dario Amodei。如今接替他的，是另一位联合创始人Tom Brown。换人背后，是一名白宫官员私下给Amodei贴的词：「weirdo」。

这并不是Anthropic第一次与政府交恶。科技媒体MIT Technology Review把这场最新的角力列为本周必须盯住的事，并梳理出三个观察看点。

与白宫的不耐烦相对的，是投资人一侧的警告。Reid Hoffman公开发声。他对政府处置Anthropic模型的方式表示担忧，而他既投了这家公司，也投了它的竞争对手。

以安全立身仍可能被政府冷处理高层谈判已换掉创始人投资人警告政府处置方式有风险

来源

The Trump White House Is Over Anthropic CEO Dario Amodeiwired.com Three things to watch amid Anthropic's latest feud with the governmenttechnologyreview.com Reid Hoffman on the government's handling of Anthropicfortune.com

03AI agent开始自己注册账号、自己部署,而注册、平台、模型三处都默认使用者是人类

一个在后台运行的AI agent写完代码要上线,第一步得注册账号,然后一头撞上为人类设计的墙:浏览器里的OAuth跳转、要手动点的仪表盘、复制粘贴的密钥、多重验证弹窗。Cloudflare上周把这堵墙拆了:跑一句wrangler deploy --temporary就能直接上线代码,生成的临时账号存活60分钟,期间认领就永久归你,不认领自动过期。

agent第一次有了属于自己的身份,可平台正朝相反方向收紧。Claude开始强制身份验证,触发某些功能时会要求掏出政府签发的实体证件、对着摄像头拍一张实时自拍,几分钟内确认坐在屏幕前的到底是谁。

更深的问题藏在模型内部。一篇研究把prompt injection重新解释成一个角色混淆问题:模型读到的不是分turn的对话,而是一整条连续字符串,系统提示、用户消息、工具返回全挤在一起。它没法可靠分辨哪句是用户下的指令,哪句是从某个网页里读到、被人塞进来的命令。

而Cloudflare的设计初衷,正是让agent反复试错:写完、部署、用curl验证输出、再改,这个循环里没有人盯着。

agent能自主注册部署,跑偏也无人拦截模型无法可靠区分用户指令与网页注入平台开始要求实体证件加实时自拍

来源

Temporary Cloudflare accounts for AI agentsblog.cloudflare.com Identity verification on Claudesupport.claude.com Prompt Injection as Role Confusionrole-confusion.github.io

Gemini 3.5 Flash内置computer use能力 Google DeepMind把原本独立的Gemini 2.5 computer use模型整合进主力模型Gemini 3.5 Flash，开发者可直接用它构建能在浏览器、移动端和桌面环境中看、推理并操作的agent。同时发布两项企业安全开关：敏感操作需用户确认、检测到prompt injection时自动停止任务。 deepmind.google

OpenAI推出Daybreak安全工具，含GPT-5.5-Cyber OpenAI发布Daybreak系列工具，包括Codex Security和专用模型GPT-5.5-Cyber，用于大规模发现、验证和修补漏洞。 openai.com

Groq确认融资6.5亿美元并重组高管团队 在Nvidia那笔200亿美元的「非收购式挖人」之后，AI芯片公司Groq确认完成6.5亿美元融资，转向其neocloud业务并招募新高管。 techcrunch.com

Agility Robotics拟通过SPAC上市，估值25亿美元 2015年从俄勒冈州立大学分拆的人形机器人公司Agility Robotics计划借SPAC上市，预计募资6.2亿美元。 techcrunch.com

Meta推出脱离Ray-Ban的更便宜智能眼镜 Meta发布全新Meta Glasses产品线，不再与Ray-Ban绑定，提供三种款式、七种颜色，其中一款与名媛Kylie Jenner联名。 theverge.com

Figma在Config大会上线AI动态图形与shader工具 Figma发布新设计与编程功能，包括为全栈开发重构的画布，把团队、AI agent和工具整合到同一空间，并用AI自动化重复性工作。 theverge.com

NVIDIA AI服务器冷却液上限提到45°C NVIDIA最新AI服务器允许冷却液温度升至45°C（113°F），高于普通热水浴的38到40°C，更高的温度上限带来更好的能效。 blogs.nvidia.com

ASML的4亿美元光刻机 MIT Technology Review探访ASML最新一代芯片制造设备：重逾150吨、体积相当于一辆双层巴士，单台造价约4亿美元。 technologyreview.com

Anthropic发布Claude Tag Anthropic推出新功能Claude Tag。 anthropic.com

TechCrunch更新2026年AI相关裁员名单 TechCrunch按时间倒序持续记录今年明确把AI列为裁员因素的大型科技公司。 techcrunch.com