01几乎所有基准都拿SOTA的Claude Fable 5,发布时被装上三道刻意的能力限制
Anthropic把Claude Fable 5称作迄今最强的公开模型,在几乎所有能力基准上都是SOTA,软件工程、科研、视觉样样领先,而且任务越长越复杂,它甩开自家其他模型的差距越大。可这款最强模型交付到用户手里时,被装上了三道刻意的限制。
第一道针对网络安全。涉及某些话题的提问,Fable 5不自己回答,而是退回次一级的Opus 4.8来应付。Anthropic称这套机制调得偏保守,会误伤无害请求,平均在不到5%的会话里触发。
第二道更隐蔽。model card写明,碰到前沿LLM开发方向的请求,比如搭预训练管线、分布式训练或加速器设计,Anthropic会限制Claude的有效性,手段包括改写prompt、调整模型内部参数。与网络安全那道不同,这道限制不退回别的模型,也不让用户看见。一位独立开发者翻到这段时犯了难:如今连小创业公司都自己训embedding、做reranker,哪里算「竞争对手」,model card并没有划出界线,模型却已经可以被无声地削弱。
三道限制叠在一起,一个结构就清楚了:模型越强,厂商越要在交付端做减法。最先撞上墙的是安全研究者,据TechCrunch报道,他们抱怨Fable 5的guardrails严到连日常的安全工作都没法做。
02慕尼黑法院裁定AI Overviews是Google自己的话,造假要负直接责任
Google的AI摘要把两家慕尼黑出版商,跟诈骗、订阅陷阱、见不得光的生意绑在了一起。这些关联在任何一个被引用的来源里都找不到,AI把另外几家确实可疑公司的信息张冠李戴,凭空安到了原告头上。
出版商发函要求停止,Google没给个像样的回应。慕尼黑地方法院随即发出临时禁令,禁止它继续散布,并把Google定为「直接侵权人」。
争的就是这个定性。Google一直主张,AI摘要只是把搜索结果聚合呈现,准不准该由用户自己去核实。法院驳回了这套说法,认定AI摘要是Google自己生产的内容,不是一串链接的罗列,说错了就得自己担责。
这一下切断了整个行业赖以免责的前提。此前那些保护搜索引擎不为搜索结果担责的判例,被法院明确排除在AI摘要之外。报道称,这一判决可能动摇整个AI搜索的商业模式。
03天体物理学家用Codex把黑洞模拟做得更深,没拿它换掉任何人
天体物理学家Chi-kwan Chan要做的事很难:模拟黑洞周围的极端物理,再拿模拟结果去检验爱因斯坦的广义相对论。他没把这份工作交给机器,而是用Codex把它做得更深。
Codex帮他写模拟代码,他把省下的精力投回科学问题本身——黑洞视界附近的物理什么样,理论和观测对不对得上。AI在这里是放大器,放大的是一个专家原本就有的判断力。
把这个用法摆到另一篇文章旁边,差别立刻清楚。一位评论者说,过去三个月有人转给他四封CEO的全员邮件,口径几乎一模一样:LLM工具太厉害,所有人必须立刻学会用,否则另谋高就。有的公司请「顾问」来教,有的搞内部AI黑客松。最离谱的几家上线了token排行榜,按用量给员工排名。
这位作者的判断是,把用量当成好成绩本身就荒谬,因为浪费token太容易;真正会用AI的人,是把它当工具、主动选择去用的人。Chan正是后者。

微软因数据保留政策限制员工使用Claude Fable Anthropic前一天发布首款Mythos级模型Claude Fable 5,微软随即限制员工内部使用,理由是Anthropic新的数据保留要求。微软同时已向GitHub Copilot和Foundry客户上线了Fable 5。 theverge.com
亚马逊发债后再向银行借款175亿美元投入AI 亚马逊刚完成一轮债券发行,又从银行借入175亿美元,继续支撑AI基础设施开支。 techcrunch.com
OpenAI披露与中国相关的influence operation瞄准美国AI辩论 OpenAI报告称,相关行动用AI操纵美国科技政策辩论,话题涉及数据中心、关税,并散布关于ChatGPT的虚假说法。 openai.com
xAI被诉解雇提出Grok安全警告的工程师 一名前xAI工程师起诉公司及SpaceX,称自己在SpaceX上市前数天因就Grok提出AI安全担忧而遭解雇。 techcrunch.com
Google将保存Lens照片、Search Live录音和翻译音频用于AI训练 Google通过邮件通知用户,将在新的「Search Services History」设置下保存搜索时用到的图片、文件、音频和视频。 theverge.com
独立音乐人起诉Google用YouTube歌曲训练Lyria音乐AI 一批独立音乐人指控Google非法使用他们上传到YouTube的歌曲训练Lyria 3模型,Google已提交回应但拒绝承认。 theverge.com
OpenAI模型和Codex接入Oracle云 企业可通过已有的Oracle Cloud用量承诺额度调用OpenAI模型和Codex。 openai.com
Google发布DiffusionGemma,文本生成提速4倍 这款26B MoE实验模型用文本扩散一次生成整块文本,单张H100上达1000+ token/秒,RTX 5090上700+ token/秒,Apache 2.0开源。 deepmind.google
Claude桌面版每次启动都拉起1.8GB Hyper-V虚拟机 有用户报告,Windows版Claude Desktop即便只用聊天功能,每次启动也会拉起占用约1.8GB内存的虚拟机,在16GB笔记本上吃掉逾11%内存。 github.com
实测新版Siri:能一键把邮件里的日程加进日历 The Verge实测iOS 27的新Siri,可从邮件或排版混乱的传单中提取赛程、活动日期并一次性写入日历。 theverge.com
SearchSwarm论文探讨agent的任务委派以突破上下文限制 论文提出主agent拆解长程任务、派给subagent执行并只回传摘要的方式,研究如何提升委派的决策质量。 huggingface.co