Copilot「仅供娱乐」，AI全面转向够用就行

01开发者为Claude Code自建拆解指南，同一周配额耗尽投诉激增

一名开发者从公开源码中拆出了Claude Code的完整内部结构，做成可视化指南发布。这份指南上周登上Hacker News首页，拿下1000多票。

指南展开了agent循环的11个步骤、52个内置工具和95条命令。它还挖出了几个未发布的隐藏功能：一个根据账号生成的终端虚拟宠物、一个跨会话自动整理记忆的持久模式、一个执行窗口长达30分钟的深度规划系统。社区成员自发为商业工具做这种程度的拆解，即便在开源项目中也不多见。

但同一周，大量配额投诉涌入了Anthropic的社区论坛。一位每月付100美元订阅最高档计划的开发者说，自己「1小时就把配额用光了，以前能用8小时」。另一位年费用户称自己「一个月里只有12天能用上Claude」。

几个因素同时撞在一起。3月28日，一项将非高峰时段配额翻倍的促销到期。前一周Anthropic宣布在高峰时段削减配额，称只影响约7%的用户。更棘手的是，有用户逆向分析后发现两个独立bug会导致提示缓存失效。实际token消耗因此膨胀10到20倍，多名用户证实回退到旧版本后情况明显改善。

Anthropic随后承认「用户撞上配额的速度远超预期」，称这是团队的「最高优先级」。但AI工具和传统软件服务不一样。每多一个重度用户都意味着真实的GPU开销，边际成本不趋近于零。一位开发者提醒：在自动化工作流中，限速错误看起来像普通故障，会触发静默重试，「一个循环中的单个会话几分钟就能耗光一整天的预算」。

GPU边际成本非零，重度用户越多供给压力越大缓存bug让实际消耗膨胀10-20倍配额不透明，开发者无法规划工作节奏

来源

Claude Code Unpacked: A visual guideccunpacked.dev Anthropic admits Claude Code users hitting usage limits 'way faster than expected'theregister.com

02Microsoft法律条款称Copilot「仅供娱乐」，GitHub同月把广告塞进代码审查

Copilot个人版的服务条款白纸黑字写着：for entertainment purposes only，仅供娱乐用途。这类措辞通常出现在游戏和占卜类应用的条款里。Microsoft把它用在了一款面向开发者的编码工具上。

同一个月，GitHub在代码审查页面插入了这个工具的广告。代码审查是开发者审阅代码、决定能否合并上线的环节，整个开发流程中最需要严肃对待的一步。社区反弹后，广告被撤回了。

一边是法律团队用最保守的定义划清责任：出了问题别找我们，这是娱乐产品。一边是产品团队往开发者最严肃的工作流里塞广告。两个方向截然相反，出自同一家公司。

法律缩小责任边界，产品扩大使用场景，这个矛盾是结构性的。GitHub对这款工具按月收费，面向个人开发者和企业团队销售。在服务条款页面上，它的法律定义依然是「娱乐」。

企业客户可能重新审视采购依据竞对可借免责条款争夺客户开发者需重新评估代码输出可靠性

来源

Microsoft Copilot Terms of Usemicrosoft.com GitHub backs down, kills Copilot pull-request ads after backlashtheregister.com

03银行客服用mini，视频模型出Lite，AI转向「刚好够用」

Gradient Labs给银行做智能客服。模型选的是GPT-5.4系列里的mini和nano，旗舰版放在一边没碰。OpenAI官方博客写了原因：银行客服对延迟和稳定性的要求远高于推理深度，小模型反而更合适。

谷歌在视频领域做了类似选择。上周发布的Veo 3.1 Lite直接把轻量版做成了独立产品线，而不是旗舰的缩水附属。两家公司在完全不同的领域做出了同样的产品决策：优先适配场景，而非堆叠绝对性能。

MIT技术评论的一篇分析解释了这个转变为什么正在发生：通用大模型每代10倍能力跳跃的时代结束了，增长曲线变成了渐进式改善。但在垂直场景里，当模型与特定领域的数据深度融合，仍然能拿到阶梯式提升。文章的结论是，模型定制已从可选优化变成架构层面的刚需。

企业部署从追求最强转向场景匹配模型厂商主动推轻量产品线通用模型增长放缓倒逼垂直定制

来源

Gradient Labs gives every bank customer an AI account manageropenai.com Shifting to AI model customization is an architectural imperativetechnologyreview.com Build with Veo 3.1 Liteblog.google

零工经济新工种：在家录视频训练人形机器人 MIT Technology Review报道，全球各地的零工工作者正将手机绑在头上，录制自己完成日常动作的视频，为人形机器人提供训练数据。一位尼日利亚医学生每天下班后在出租屋里录制动作片段，成为这条新兴数据供应链的一环。 technologyreview.com

Lingshu-Cell发布：用掩码离散扩散模型模拟细胞状态 研究团队提出Lingshu-Cell，一个学习转录组状态分布的生成式细胞世界模型，支持对扰动的条件模拟。该模型将单细胞基础模型从静态表征扩展到生成式模拟，朝「虚拟细胞」方向推进。 huggingface.co

Project Imaging-X整理超过1000个开放医学影像数据集 一项调研系统梳理了1000多个公开可用的医学影像数据集，为医学基础模型开发提供统一的数据索引。论文指出，临床标注依赖和隐私限制一直是医学大规模数据集稀缺的主因。 huggingface.co

GEMS提出agent原生的多模态生成框架 受Claude Code等agent框架启发，GEMS将记忆和技能机制引入多模态生成模型，使其在复杂指令和下游专业任务上突破基础模型的固有限制。框架由三个核心组件构成，覆盖通用与垂直场景。 huggingface.co

EpochX搭建面向agent经济的基础设施 论文提出EpochX，一个以积分为原生结算单位的agent市场基础设施，解决大规模场景下任务委派、验证和激励分配问题。作者认为AI agent的瓶颈正从单体能力转向协作与生产组织方式。 huggingface.co

CARLA-Air在驾驶模拟器中加入无人机，统一空地仿真 CARLA-Air将多旋翼无人机动力学集成进CARLA驾驶模拟器，首次在同一物理一致环境中支持空中和地面agent的联合仿真。此前开源平台的驾驶模拟和飞行模拟彼此隔离，桥接方案存在同步开销。 huggingface.co

FIPO用token级奖励信号改进LLM推理训练 FIPO算法对GRPO类训练方法做出改进：将全局outcome奖励细化到token级别，区分关键逻辑转折点和无关token的贡献。作者认为粗粒度的均匀信用分配是现有推理训练的性能天花板之一。 huggingface.co

TAPS研究：针对任务微调草稿模型可大幅提升推测解码效率 研究用HASS和EAGLE-2草稿模型在MathInstruct、ShareGPT等不同数据上训练，发现草稿模型的训练分布对推测解码质量有显著影响。任务匹配的草稿分布能提高token接受率，降低推理延迟。 huggingface.co