百万泄露密钥突然变危险,汉堡王给员工耳机装上了AI

01Google API密钥从「公开标识符」变成「AI通行证」,数百万泄露密钥突然变危险了

Google花了二十年告诉开发者:API密钥不是机密。它只是个公开的身份标识符,用来做速率限制和流量统计,泄露了也无所谓。成千上万的开发者照做了,密钥硬编码在前端代码里,散落在GitHub仓库中,嵌在网页的JavaScript里。

然后Gemini来了,规则变了。

安全公司Truffle Security本周披露,同一种以AIza开头的Google API密钥,现在能直接调用Gemini的全部能力——读取上传的私有文件、访问缓存数据、以密钥持有者的账户调用大模型。他们扫描了数百万个网站,找到近3000把公开暴露的密钥已经能静默通过Gemini认证,其中有几把属于Google自己,最早的一把从2023年2月就挂在外面,比Gemini API上线还早。

问题出在Google Cloud的密钥架构上:一个项目里所有API密钥共享同一种格式,当项目启用了Gemini服务,原本只用于Maps或Translate的密钥就自动获得了AI能力。没有确认弹窗,没有邮件通知,没有任何提示。Truffle Security去年12月向Google报告了这个漏洞,Google将其定级为「单服务权限提升」,确认已开始限制泄露密钥访问Gemini,但截至今年2月仍在修复根因。这条披露在Hacker News上拿到1193票和286条评论,开发者社区的焦虑可见一斑。

修还没修完,密钥能做的事又多了。Google本周发布了Nano Banana 2图像生成模型并接入Gemini API,意味着一把泄露的密钥现在不仅能调用语言模型,还能生成图像,攻击者可利用的能力面还在扩大。

Truffle Security给出的建议很直接:检查你的项目是否启用了Generative Language API,审计所有公开暴露的密钥,立即轮换。但对那些已经在公开代码库里躺了多年的密钥来说,谁该负责去找到它们、谁有能力找到它们,Google至今没给出明确答案。

二十年「密钥不是机密」的安全假设被AI能力扩展击穿数百万已泄露密钥从无害变成可利用,且无法逐一通知所有持有者Google根因修复仍未完成,而Gemini API能力仍在持续扩展

02汉堡王给员工耳机装了个AI,既教做汉堡也给礼貌打分

汉堡王正在员工耳机里植入一个叫Patty的AI语音助手。它能实时指导餐品制作、回答操作问题,听起来是个称手的工具。但Patty同时也在监听员工与顾客的对话,评估他们是否足够「友好」——有没有说「请」和「谢谢」。

同一个设备,同一个AI,左手帮忙,右手打分。汉堡王首席数字官Thibault Roux称整套系统旨在「辅助员工」。但当辅助你的系统同时在量化你的态度,「辅助」这个词就需要重新掂量。

这恰好撞上行业最热的叙事。《麻省理工科技评论》本周刊文谈「工业5.0」转型,核心主张是AI应当以人为本,从技术整合走向增强人的能力,人和机器是协作关系。

Patty完全可以被装进这套话语。但耳机里那个评估友好度的功能,把协作和考核焊在了同一个系统里。员工无法只接受帮助而拒绝被评判,因为两者来自同一个声音。

Roux没有透露评估结果会如何影响员工绩效或薪资。

AI助手与AI监工合为同一系统「人机协作」叙事掩盖权力单向性一线服务业员工最先承受这种模糊

03模型不再是护城河,OpenAI一周内连签两份集成合作

上周,分析师Ben Evans发了一篇长文,核心问题只有一个:当模型性能趋同,OpenAI拿什么竞争?同一周,两份合作公告给出了回答。

第一份是Figma集成。OpenAI把代码生成能力直接嵌入设计画布,设计师操作界面的同时,代码在后台同步生成,不再需要在工具之间来回切换。这不是又一个API接入,而是焊进了设计师的日常工作流。

第二份指向截然不同的场景。太平洋西北国家实验室与OpenAI合作,推出了一套评估基准。这套基准测试AI起草联邦环境审批文件的能力,初步结果显示起草时间最多缩短15%。

两笔合作的逻辑一致:不比模型跑分,而是把产品嵌进合作伙伴离不开的工作环节。Evans在文章里判断,模型层差异正在缩小,壁垒将来自分发和集成。这周OpenAI签下的两个场景,一个是设计工具,一个是政府审批,都是替换成本极高的流程。

竞争焦点从模型性能转向工作流嵌入深度联邦合作开辟政府基础设施新入口平台化壁垒依赖合作伙伴而非自有技术
04

Google发布Nano Banana 2图像生成模型,Pro级能力向免费用户开放 Nano Banana 2(即Gemini 3.1 Flash Image)今日在Gemini应用及其他Google AI平台上线,将此前仅限Pro用户的知识理解和高保真渲染能力以Flash速度提供给所有用户,同时向开发者开放API。 deepmind.google

05

Karpathy称编程代理在去年12月迎来质变,此前「基本不能用」 Andrej Karpathy表示AI编程的变化不是渐进式的,而是在去年12月突然发生:模型质量、长程连贯性和执行韧性大幅提升,编程代理从「基本不能用」变成「基本能用」,对默认编程流程构成极大冲击。 simonwillison.net

06

SkyReels-V4发布:统一视频-音频生成、修复和编辑的多模态基础模型 SkyReels V4采用双流多模态扩散Transformer架构,一路合成视频,一路生成时间对齐的音频,支持文本、图像、视频片段、蒙版和音频参考等多模态指令输入。 huggingface.co

07

DREAM框架评估深度研究代理,揭示「合成幻象」问题 研究发现深度研究代理生成的报告存在「合成幻象」——表面流畅的文本和准确的引用格式掩盖了底层的事实与推理缺陷。DREAM提出跨四个维度的分类体系来暴露这一盲区。 huggingface.co

08

Samsung Galaxy S26搭载最新Android AI功能 Google在Samsung Unpacked 2026上展示了Galaxy S26设备将获得的最新Android AI功能。 blog.google

09

Google翻译新增AI语境理解功能 Google翻译加入「替代翻译」「理解」和「提问」三个按钮,用户可查看同一句话的不同译法,并向AI追问翻译背后的语境和用法差异。 blog.google

10

Simon Willison总结代理工程模式:囤积你会做的事 Simon Willison发布「代理工程模式」系列文章,核心建议是积累你对技术可行性和实现路径的认知——这些知识在指导编程代理时价值倍增。 simonwillison.net

11

PyVision-RL解决多模态代理训练中的「交互坍缩」问题 针对强化学习训练中模型逐渐放弃使用工具和多轮推理的现象,PyVision-RL提出过采样-过滤-排序的rollout策略和累积工具奖励机制,在开源多模态模型上稳定了代理行为。 huggingface.co

12

LongCLI-Bench评估AI代理的长程命令行编程能力 该基准针对现有评估中任务周期短、GitHub数据污染严重、缺乏细粒度指标等问题,为真实软件工程场景下的长程规划与执行能力提供评估框架。 huggingface.co

13

Vibe coding会重蹈创客运动的覆辙吗? 一篇讨论文章将当前的vibe coding热潮与创客运动类比,追问两者在大众参与度和长期可持续性上是否面临相似的瓶颈。 read.technically.dev