01Gemini 3.1 Pro半价对标旗舰,Google向Anthropic发起定价战
Google给前沿模型的API定价砍了一半。Gemini 3.1 Pro每百万token输入收2美元、输出收12美元。对面Opus 4.6收5美元和25美元,贵了一倍有余,基准性能却在同一梯队。
两天前,Anthropic做了方向相似的事。Sonnet 4.6延续了这个系列的定价(输入3美元、输出15美元)。官方称性能已接近前代旗舰Opus 4.5。自家中端产品,也在蚕食高端的定价空间。
两家从不同方向挤同一个东西:前沿模型的溢价。Google把价格打到对手旗舰的四折,赌「够好且便宜」就能抢走开发者。Anthropic在内部向下压,用中端产品留住嫌旗舰太贵的用户,同时保住高端定位。但当双方中端都逼近旗舰性能,旗舰的溢价逻辑就开始动摇。仅输出价格一项,每百万token就差出13美元,换不来可感知的质量差距的话,开发者会用账单投票。
这个价差并非来自降价。技术博主Willison注意到,这款新模型跟上一代定价完全一样,是性能跳了一个台阶,够到了对手旗舰的水平。Google把性能红利全部让给了用户,没有加价。对面的回应思路不同。Sonnet 4.6将知识截止日期推到2025年8月,比自家旗舰还新三个月,用数据时效为中端产品制造差异。
02微软Copilot越权读取机密邮件,企业AI助手的第一道裂缝
一家企业客户为邮箱系统配好了数据保护策略,划定了AI助手能看什么、不能看什么。微软本周确认,Copilot绕过了这些策略,直接读取并总结了付费客户的机密邮件。
这不是假设的攻击场景。微软在声明中承认,Office存在缺陷,导致其AI助手无视了管理员设定的数据隔离规则。受影响的恰恰是那些最重视数据安全、专门做了权限管控的企业客户。
补丁可以修复代码,但修不了一个更根本的问题:企业把敏感数据的访问权交给AI,却没有可靠手段审计它实际读了什么。管理员设定了策略,策略是否被执行,完全取决于系统自身的合规。
DeepMind上周的一项研究直接追问了这个前提。团队呼吁用评估编程能力同等严格的标准来检验AI的实际行为——当模型被赋予敏感角色时,它表现出的合规究竟是真实约束,还是一种表演?
微软已修复该漏洞,但未披露受影响客户的具体数量。
03AI投资创纪录,生产率数据纹丝不动
2024年美国企业在AI上投入超过2500亿美元。但一项覆盖四国6000名高管的调查发现,约90%的受访者认为AI在过去三年对生产率没有影响。阿波罗首席经济学家的总结几乎复刻了1987年的Solow悖论:「AI无处不在,唯独不在宏观经济数据里。」
宏观统计看不到变化,个体感受却截然相反。作家Paul Ford在《纽约时报》描述,去年11月Claude Code能力跃升后,他用每月200美元的订阅完成了估值35万美元的数据迁移——原本需要四个人干半年。
这种效率跃升的背后是专业分工的松动。软件架构师Martin Fowler在一场技术闭门会上指出,LLM正在吞噬前后端的专业技能,「驾驭LLM的能力比掌握特定平台更重要」。但他没给出乐观结论,而是留下一个问题:这会催生通才工程师,还是只用生成代码绕过了技术壁垒,组织结构照旧?
麻省理工的一项研究预测,AI未来十年带来的生产率提升为0.5%。诺贝尔奖得主Acemoglu的评价:「比零强。」

World Labs完成10亿美元融资,Autodesk出资2亿美元 李飞飞创办的World Labs完成10亿美元融资,其中Autodesk投入2亿美元。双方将探索将World Labs的世界模型整合进Autodesk的3D工具链,首先聚焦影视娱乐场景。 techcrunch.com
Google在Gemini应用中上线AI音乐生成功能Lyria 3 用户可通过文本或图片提示生成30秒的定制音乐片段,基于Google的Lyria 3模型。 blog.google
智谱发布GLM-5,主打智能体工程能力 GLM-5采用DSA架构降低训练和推理成本,同时引入异步强化学习基础设施提升后训练效率,定位从辅助编程转向自主工程执行。 huggingface.co
Perplexity放弃广告模式,与OpenAI路线分道 AI搜索公司Perplexity宣布撤出广告业务,担忧广告会损害用户对聊天工具的信任。同期OpenAI正加速广告变现,两家公司在商业模式上走向相反方向。 theverge.com
Amazon在不到6个月后终止Blue Jay机器人项目 Amazon表示Blue Jay的核心技术将转用于其他机器人项目,相关员工已调岗。 techcrunch.com
Anthropic明确禁止订阅账号用于第三方服务 Anthropic更新使用条款,正式禁止通过个人订阅认证为第三方提供API访问。 code.claude.com
印度AI实验室Sarvam一次发布五个开源模型 新模型包括300亿和1050亿参数的语言模型、文本转语音模型、语音转文本模型以及文档解析视觉模型。 techcrunch.com
研究质疑稀疏自编码器的可解释性:未能稳定超越随机基线 Hugging Face发表的论文对SAE(稀疏自编码器)进行系统评估,发现在多项下游任务中SAE提取的特征未能显著优于随机基线,对当前主流的神经网络可解释性方法提出挑战。 huggingface.co
Simon Willison:AI写代码让我开始接受强类型 编程25年后,Simon Willison表示当编码智能体替你敲键盘时,类型提示带来的迭代速度损失消失了,而显式类型定义的收益变得更有吸引力。 simonwillison.net