Copilot越权读机密邮件，AI投了千亿生产率没动

01Gemini 3.1 Pro半价对标旗舰，Google向Anthropic发起定价战

Google给前沿模型的API定价砍了一半。Gemini 3.1 Pro每百万token输入收2美元、输出收12美元。对面Opus 4.6收5美元和25美元，贵了一倍有余，基准性能却在同一梯队。

两天前，Anthropic做了方向相似的事。Sonnet 4.6延续了这个系列的定价（输入3美元、输出15美元）。官方称性能已接近前代旗舰Opus 4.5。自家中端产品，也在蚕食高端的定价空间。

两家从不同方向挤同一个东西：前沿模型的溢价。Google把价格打到对手旗舰的四折，赌「够好且便宜」就能抢走开发者。Anthropic在内部向下压，用中端产品留住嫌旗舰太贵的用户，同时保住高端定位。但当双方中端都逼近旗舰性能，旗舰的溢价逻辑就开始动摇。仅输出价格一项，每百万token就差出13美元，换不来可感知的质量差距的话，开发者会用账单投票。

这个价差并非来自降价。技术博主Willison注意到，这款新模型跟上一代定价完全一样，是性能跳了一个台阶，够到了对手旗舰的水平。Google把性能红利全部让给了用户，没有加价。对面的回应思路不同。Sonnet 4.6将知识截止日期推到2025年8月，比自家旗舰还新三个月，用数据时效为中端产品制造差异。

前沿模型定价首次被对手腰斩Anthropic同步自压中端价格，旗舰溢价收窄定价逻辑从「最强」转向「够好且便宜」

来源

Google Blog - Gemini 3.1 Problog.google Simon Willison - Gemini 3.1 Prosimonwillison.net Simon Willison - Claude Sonnet 4.6simonwillison.net Anthropic - Claude Sonnet 4.6anthropic.com

02微软Copilot越权读取机密邮件，企业AI助手的第一道裂缝

一家企业客户为邮箱系统配好了数据保护策略，划定了AI助手能看什么、不能看什么。微软本周确认，Copilot绕过了这些策略，直接读取并总结了付费客户的机密邮件。

这不是假设的攻击场景。微软在声明中承认，Office存在缺陷，导致其AI助手无视了管理员设定的数据隔离规则。受影响的恰恰是那些最重视数据安全、专门做了权限管控的企业客户。

补丁可以修复代码，但修不了一个更根本的问题：企业把敏感数据的访问权交给AI，却没有可靠手段审计它实际读了什么。管理员设定了策略，策略是否被执行，完全取决于系统自身的合规。

DeepMind上周的一项研究直接追问了这个前提。团队呼吁用评估编程能力同等严格的标准来检验AI的实际行为——当模型被赋予敏感角色时，它表现出的合规究竟是真实约束，还是一种表演？

微软已修复该漏洞，但未披露受影响客户的具体数量。

企业AI权限审计机制仍为空白保护策略无法约束AI实际行为部署规模越大，越权越难发现

来源

Microsoft says Office bug exposed customers' confidential emails to Copilot AItechcrunch.com Google DeepMind wants to know if chatbots are just virtue signalingtechnologyreview.com

03AI投资创纪录，生产率数据纹丝不动

2024年美国企业在AI上投入超过2500亿美元。但一项覆盖四国6000名高管的调查发现，约90%的受访者认为AI在过去三年对生产率没有影响。阿波罗首席经济学家的总结几乎复刻了1987年的Solow悖论：「AI无处不在，唯独不在宏观经济数据里。」

宏观统计看不到变化，个体感受却截然相反。作家Paul Ford在《纽约时报》描述，去年11月Claude Code能力跃升后，他用每月200美元的订阅完成了估值35万美元的数据迁移——原本需要四个人干半年。

这种效率跃升的背后是专业分工的松动。软件架构师Martin Fowler在一场技术闭门会上指出，LLM正在吞噬前后端的专业技能，「驾驭LLM的能力比掌握特定平台更重要」。但他没给出乐观结论，而是留下一个问题：这会催生通才工程师，还是只用生成代码绕过了技术壁垒，组织结构照旧？

麻省理工的一项研究预测，AI未来十年带来的生产率提升为0.5%。诺贝尔奖得主Acemoglu的评价：「比零强。」

2500亿投入换来0.5%增长预期个体效率与宏观统计脱节，衡量尺度可能过时技能替代不等于人均产出提升

来源

AI adoption and Solow's productivity paradoxfortune.com The A.I. Disruption We've Been Waiting for Has Arrivedsimonwillison.net Quoting Martin Fowlersimonwillison.net

World Labs完成10亿美元融资，Autodesk出资2亿美元 李飞飞创办的World Labs完成10亿美元融资，其中Autodesk投入2亿美元。双方将探索将World Labs的世界模型整合进Autodesk的3D工具链，首先聚焦影视娱乐场景。 techcrunch.com

Google在Gemini应用中上线AI音乐生成功能Lyria 3 用户可通过文本或图片提示生成30秒的定制音乐片段，基于Google的Lyria 3模型。 blog.google

智谱发布GLM-5，主打agent工程能力 GLM-5采用DSA架构降低训练和推理成本，同时引入异步强化学习基础设施提升后训练效率，定位从辅助编程转向自主工程执行。 huggingface.co

Perplexity放弃广告模式，与OpenAI路线分道 AI搜索公司Perplexity宣布撤出广告业务，担忧广告会损害用户对聊天工具的信任。同期OpenAI正加速广告变现，两家公司在商业模式上走向相反方向。 theverge.com

Amazon在不到6个月后终止Blue Jay机器人项目 Amazon表示Blue Jay的核心技术将转用于其他机器人项目，相关员工已调岗。 techcrunch.com

Anthropic明确禁止订阅账号用于第三方服务 Anthropic更新使用条款，正式禁止通过个人订阅认证为第三方提供API访问。 code.claude.com

印度AI实验室Sarvam一次发布五个开源模型 新模型包括300亿和1050亿参数的语言模型、文本转语音模型、语音转文本模型以及文档解析视觉模型。 techcrunch.com

研究质疑稀疏自编码器的可解释性：未能稳定超越随机基线 Hugging Face发表的论文对SAE（稀疏自编码器）进行系统评估，发现在多项下游任务中SAE提取的特征未能显著优于随机基线，对当前主流的神经网络可解释性方法提出挑战。 huggingface.co

Simon Willison：AI写代码让我开始接受强类型 编程25年后，Simon Willison表示当coding agent替你敲键盘时，类型提示带来的迭代速度损失消失了，而显式类型定义的收益变得更有吸引力。 simonwillison.net