01ChatGPT把健康问答交给GPT-5.5,一份独立测试称它的幻觉是开源模型的三倍
最不容出错的领域之一,正被交给模型直接作答。这次接手的是新版GPT-5.5 Instant。OpenAI称,它在健康与养生问题上的回答更准、沟通更清楚,并且经过了医生参与的评估。
几乎同一时间,一篇独立文章给出了相反的判断:在同等问题上,GPT-5.5的幻觉率是一个开源模型的三倍。那个对手叫GLM-5.2,采用MIT许可,参数约753B、激活约40B,体量保守估计只有GPT-5.5的一半,智能评分却咬得很紧。
文章的核心主张是「更大不是出路」。作者认为,当模型被灌入海量事实数据,学到的反而是「永远给出一个答案」——不知道时也不肯承认,而是编一个听起来合理的说法。
这正是健康问答最怕的失败模式。部署者眼前是同一家厂商口径相左的两套说法:一边说经过医生评估、可以聊健康,一边被指在没把握时倾向硬答。值得注意的是,健康博文说的是GPT-5.5 Instant,而幻觉测试针对的是GPT-5.5,来源并未把这两者当作同一个变体。
02在西雅图市议会作证一周后,三名亚马逊工程师被指面临解雇
三名亚马逊软件工程师本月初站到西雅图市议会面前,就数据中心的扩张限制作证。开口第一句,他们先援引了当地一条法律:禁止雇主因员工的政治言论而歧视。
这句话很快派上了用场。听证会一周后的6月10日,三人称公司对他们采取了纪律处分,于是反过来指控亚马逊违反了那条法律——以报复打击他们的公开发声。几名普通工程师,就这么和自己所在的科技巨头当庭对上了。
把镜头从西雅图拉到华盛顿,同一股反弹也在国会山涌起。参议员Bernie Sanders抛出了一个7万亿美元的方案,要设立一只AI财富基金,让普通美国人重新掌控这个产业。方案直白地点明,最大的那几家AI公司大概率会抵触。
一边是企业内部为数据中心叫停而作证的员工,一边是华盛顿要从巨头手里夺回AI的政客。冲着AI产业权力与基建过度集中的火,正从两个方向同时烧起来。
03同一周三篇高热论文,把机器人从「听指令」推向自己摸索物理世界
机器人去拧一个门把手,难的不是抓住把手,而是把手本身没法被直接驱动,它的转动只能靠手和把手持续接触一点点「磨」出来。本周一篇拿到67次推荐的论文DragMesh-2专攻的就是这件事:多指灵巧手怎么跟门、抽屉、剪刀这类带关节的物体做出物理上站得住的交互。
单看它是一篇操作论文。但把同期另外两篇高关注论文摆到一起,方向就清楚了。一篇叫Playful Agentic Robot Learning,让机器人在接到具体任务之前先「玩」,在自由探索里攒下可复用的技能,而不是每学一个动作都得人下指令。另一篇S-Agent则把空间推理改成在持续演化的3D世界里不断累积证据,而不是对着孤立画面做一次性判断。
三篇攻的环节各不相同——灵巧操作、技能习得、空间理解——推的却是同一个转变:让机器人从「被给定任务、静态推断」走向自己探索、对物理世界持续建模。这正是此前一批世界模型公司拿大额融资时押的方向,只是这回信号来自论文,不是产品。
要说清楚的是,这三篇都还停在研究信号,没有能进客厅的家用机器人,它们补的是同一块短板:让机器自己摸清物理世界怎么运转。

诺奖得主John Jumper从DeepMind跳槽Anthropic 凭AlphaFold获诺贝尔化学奖的John Jumper离开Google DeepMind,加入竞争对手Anthropic。报道称他不是近期出走DeepMind的唯一一位重量级人物。 techcrunch.com
DeepSeek在聊天应用中上线Vision视觉功能 DeepSeek为其网页版聊天加入图像理解能力。 chat.deepseek.com
挪威近乎全面禁止小学课堂使用AI 挪威出台规定,几乎全面禁止在小学使用AI工具。 reuters.com
Signal总裁Whittaker:AI聊天机器人「不是你的朋友」 Meredith Whittaker公开提醒用户,这些聊天机器人「不是你的朋友,不是有意识的存在,也不是有感知的对话者」。 techcrunch.com
《大西洋月刊》把训练AI的音乐做成可搜索数据库 记者Alex Reisner公开四个用于训练AI模型的音乐数据集并做成可检索网站,其中两个分别含1200万和900万首曲目。 theverge.com
Salesforce内部AI排行榜让团队争夺「小奖杯」 该榜单按高管及其下属团队排序,并设功能显示哪些员工尚未拿到徽章,标注「点击看看是谁👀」。 404media.co
NVIDIA携合作伙伴在戛纳创意节展示AI广告营销 NVIDIA在Cannes Lions上联合多家合作伙伴推出面向广告营销的AI自动化方案。 blogs.nvidia.com
Allbirds新AI公司CEO:有计划,但没团队 这家由单一创始人创立的AI创业公司拿到大额种子轮,目前仍无员工。 techcrunch.com
《粉雄救兵》Karamo Brown推出含AI数字分身的健康App Kē Brown发布健康应用Kē,内置他本人的AI数字分身,覆盖健身、营养、冥想、戒断等。 techcrunch.com
TechCrunch教你关掉Google Docs里的AI 针对不断弹出的「用Gemini写作」提示,文章给出关闭步骤。 techcrunch.com