01政府要逐个审批谁能用GPT-5.6,OpenAI照办了,但放话这不该成惯例
消息传出还不到24小时,模型就上线了。
前一天,外界才得知白宫以安全为由,要求OpenAI推迟新模型的发布,让它先交给一小批合作伙伴、而非向公众开放。第二天,GPT-5.6如期亮相,只是换了个形态:旗舰版Sol、面向高强度任务的中端版Terra、轻量版Luna悉数登场,但不是谁都能用。
准入权被交到了政府手里。这一次的安排不只是延后发布日期,而是由政府对申请使用的对象逐个把关——开发者、企业、网络安全防御方、海外合作伙伴,想用上这套工具,得先过这一关。一家商业公司把自己最新模型的用户名单,交给监管者一个个圈定。
OpenAI照做了,但没有照单全收地沉默。它公开表态:「我们不认为这种政府准入流程应该成为长期默认。」紧接着补了一句,这种限制「把最好的工具挡在了用户、开发者、企业、网络防御者和全球伙伴之外,而他们正需要这些工具」。
于是这家公司被推到了一个别扭的位置上:一边交出准入权配合审查,一边公开说这套做法不对。它既没有抗命,也没有认同,而是一边执行、一边记录自己的异议。模型已经发出去了,名单仍攥在政府手里,而OpenAI把话撂在了明处。
02检查代码对不对比写出来更容易,这条几十年的老直觉在coding agent身上正被反转
计算机科学里有一条用了几十年的直觉:检查一份答案对不对,总比从头写出这份答案容易。一篇新研究说,对今天的coding agent来说,这条直觉正好倒了过来。
随着基础模型推理变强、工程框架越来越成熟,让模型生成一份复杂的候选方案早已不难,难的是可靠地判断它到底对不对。研究者点出根源:任何能造出来的验证器都只是人类意图的替身,永远不等于意图本身。生成这头在狂飙,判对错这头却追不上。
另一篇研究从奖励信号这一侧印证了同一道裂缝。结果导向的强化学习只在一整条轨迹跑完后甩出一个分数,中间每一步该鼓励还是该压制,模型得不到任何指引。稀疏的奖励管得了终点,管不了过程。
这道裂缝最先砸在部署coding agent的工程师头上。想让agent自己给自己打分、或者靠自动奖励确认产出正确,眼下都不靠谱——验证器越像人类意图,越说明它还不是。人工把关这一环,短期内拿不掉。
03Figma把AI塞进设计画布的同一周,Meta把停掉的Creator Studio重做成了AI陪伴应用
两个信号本周一起出现。Figma在年度大会Config上重做了画布,把AI动效、着色器这些过去要手动调的活儿直接嵌进设计和编码流程,还让AI agent和团队、素材在同一个空间里协作。Meta则把一度关停的Facebook Creator Studio复活,不再是原来的页面管理后台,而是一个独立的AI陪伴应用,核心是一个会手把手教创作者「怎么在Facebook涨粉」的AI助手。
一个改设计工具,一个改创作者运营工具,做的却是同一件事:AI不再是工具栏角落里多出来的几个按钮,而是被搬到了工作流的正中央,整个产品围着它重新搭。
这意味着创作者每天打开的软件,形态正在换。过去靠手感和经验堆出来的重复劳动,调动效、抠运营数据、试着色参数,正被工具默认接管。Figma给设计师省下的是反复微调的时间,Meta给创作者省下的是猜算法的精力。当这些环节交给AI,人剩下要做的,是判断哪个方向值得做。

Anthropic指控阿里巴巴大规模套取Claude,要求严惩 Anthropic称阿里巴巴动用2.5万个账号、通过2880万次对话挖取Claude,是迄今最大规模的Claude克隆行为。 arstechnica.com
苹果跳过高端M6,直接上主打AI的M7系列 苹果将放弃高端M6 Mac芯片,转而推出M7 Pro、M7 Max、M7 Ultra三款面向AI的处理器。 bloomberg.com
纽约时报指控微软为帮OpenAI侵权专门建超算 在最高法院作出不利于Sony的裁决后,纽约时报调整了对OpenAI和微软的版权诉讼主张,指控微软专门建造超级计算机协助OpenAI侵犯版权。 arstechnica.com
IBM称造出全球首个亚1纳米芯片技术 IBM发布nanostack晶体管,称是全球首个进入1纳米以下的芯片技术,可用于提升芯片性能或能效。 arstechnica.com
OpenAI挖来Uber印度负责人主管印度市场 OpenAI聘请Uber印度业务负责人,统领其美国以外最大的市场,配合在印度扩建办公室、增加合作与招聘。 techcrunch.com
韩国计划把全军训练成「无人机战士」 韩国将把约50万规模的全体军队训练成无人机操作员,把无人机定位为「通用作战工具」。 arstechnica.com
Netris获a16z领投1500万美元A轮 Netris的软件运行在网络交换机上,帮助neocloud运营商缩短上线时间,本轮由a16z领投。 techcrunch.com
阿里提出Qwen-Image-Agent补上文生图的「上下文鸿沟」 针对真实需求常常表述不全或依赖最新知识的问题,Qwen-Image-Agent用一套整合plan、reason、search、memory、feedback的agentic框架来弥补用户意图与生成所需上下文之间的差距。 huggingface.co
一篇论文提出按系统拆解评测agent记忆 现有评测仍把agent记忆当黑箱、只看F1/BLEU等端到端指标,该论文主张把存储、检索、更新、整合、生命周期治理等环节拆开来评测agent的记忆系统。 huggingface.co