政府逐个审批谁能用GPT-5.6，OpenAI照办还撂下一句不该成惯例

01政府要逐个审批谁能用GPT-5.6，OpenAI照办了，但放话这不该成惯例

消息传出还不到24小时，模型就上线了。

前一天，外界才得知白宫以安全为由，要求OpenAI推迟新模型的发布，让它先交给一小批合作伙伴、而非向公众开放。第二天，GPT-5.6如期亮相，只是换了个形态：旗舰版Sol、面向高强度任务的中端版Terra、轻量版Luna悉数登场，但不是谁都能用。

准入权被交到了政府手里。这一次的安排不只是延后发布日期，而是由政府对申请使用的对象逐个把关——开发者、企业、网络安全防御方、海外合作伙伴，想用上这套工具，得先过这一关。一家商业公司把自己最新模型的用户名单，交给监管者一个个圈定。

OpenAI照做了，但没有照单全收地沉默。它公开表态：「我们不认为这种政府准入流程应该成为长期默认。」紧接着补了一句，这种限制「把最好的工具挡在了用户、开发者、企业、网络防御者和全球伙伴之外，而他们正需要这些工具」。

于是这家公司被推到了一个别扭的位置上：一边交出准入权配合审查，一边公开说这套做法不对。它既没有抗命，也没有认同，而是一边执行、一边记录自己的异议。模型已经发出去了，名单仍攥在政府手里，而OpenAI把话撂在了明处。

政府逐个审批AI模型用户，开发者准入多一道关卡商业开放与监管把关首次正面相撞OpenAI公开留异议，后续是否常态化待观察

来源

OpenAI unveils GPT-5.6 amid US AI regulatory dramatheverge.com OpenAI limits GPT-5.6 rollout after government requesttechcrunch.com The White House is asking OpenAI to slow roll the releasetechcrunch.com

02检查代码对不对比写出来更容易，这条几十年的老直觉在coding agent身上正被反转

计算机科学里有一条用了几十年的直觉：检查一份答案对不对，总比从头写出这份答案容易。一篇新研究说，对今天的coding agent来说，这条直觉正好倒了过来。

随着基础模型推理变强、工程框架越来越成熟，让模型生成一份复杂的候选方案早已不难，难的是可靠地判断它到底对不对。研究者点出根源：任何能造出来的验证器都只是人类意图的替身，永远不等于意图本身。生成这头在狂飙，判对错这头却追不上。

另一篇研究从奖励信号这一侧印证了同一道裂缝。结果导向的强化学习只在一整条轨迹跑完后甩出一个分数，中间每一步该鼓励还是该压制，模型得不到任何指引。稀疏的奖励管得了终点，管不了过程。

这道裂缝最先砸在部署coding agent的工程师头上。想让agent自己给自己打分、或者靠自动奖励确认产出正确，眼下都不靠谱——验证器越像人类意图，越说明它还不是。人工把关这一环，短期内拿不掉。

别让coding agent自评确认产出正确人工验证短期省不掉自动奖励仍只是人类意图的替身

来源

The Verification Horizon: No Silver Bullet for Coding Agent Rewardshuggingface.co OPID: On-Policy Skill Distillation for Agentic Reinforcement Learninghuggingface.co

03Figma把AI塞进设计画布的同一周，Meta把停掉的Creator Studio重做成了AI陪伴应用

两个信号本周一起出现。Figma在年度大会Config上重做了画布，把AI动效、着色器这些过去要手动调的活儿直接嵌进设计和编码流程，还让AI agent和团队、素材在同一个空间里协作。Meta则把一度关停的Facebook Creator Studio复活，不再是原来的页面管理后台，而是一个独立的AI陪伴应用，核心是一个会手把手教创作者「怎么在Facebook涨粉」的AI助手。

一个改设计工具，一个改创作者运营工具，做的却是同一件事：AI不再是工具栏角落里多出来的几个按钮，而是被搬到了工作流的正中央，整个产品围着它重新搭。

这意味着创作者每天打开的软件，形态正在换。过去靠手感和经验堆出来的重复劳动，调动效、抠运营数据、试着色参数，正被工具默认接管。Figma给设计师省下的是反复微调的时间，Meta给创作者省下的是猜算法的精力。当这些环节交给AI，人剩下要做的，是判断哪个方向值得做。

设计师/创作者日常工具形态正被重构重复调参和运营猜测被默认接管选工具看的不再是功能多少，而是AI嵌得多深

来源

Figma now has AI motion graphics and shader toolstheverge.com Facebook's Creator Studio has been revived as an AI companion apptheverge.com

Anthropic指控阿里巴巴大规模套取Claude，要求严惩 Anthropic称阿里巴巴动用2.5万个账号、通过2880万次对话挖取Claude，是迄今最大规模的Claude克隆行为。 arstechnica.com

苹果跳过高端M6，直接上主打AI的M7系列 苹果将放弃高端M6 Mac芯片，转而推出M7 Pro、M7 Max、M7 Ultra三款面向AI的处理器。 bloomberg.com

纽约时报指控微软为帮OpenAI侵权专门建超算 在最高法院作出不利于Sony的裁决后，纽约时报调整了对OpenAI和微软的版权诉讼主张，指控微软专门建造超级计算机协助OpenAI侵犯版权。 arstechnica.com

IBM称造出全球首个亚1纳米芯片技术 IBM发布nanostack晶体管，称是全球首个进入1纳米以下的芯片技术，可用于提升芯片性能或能效。 arstechnica.com

OpenAI挖来Uber印度负责人主管印度市场 OpenAI聘请Uber印度业务负责人，统领其美国以外最大的市场，配合在印度扩建办公室、增加合作与招聘。 techcrunch.com

韩国计划把全军训练成「无人机战士」 韩国将把约50万规模的全体军队训练成无人机操作员，把无人机定位为「通用作战工具」。 arstechnica.com

Netris获a16z领投1500万美元A轮 Netris的软件运行在网络交换机上，帮助neocloud运营商缩短上线时间，本轮由a16z领投。 techcrunch.com

阿里提出Qwen-Image-Agent补上文生图的「上下文鸿沟」 针对真实需求常常表述不全或依赖最新知识的问题，Qwen-Image-Agent用一套整合plan、reason、search、memory、feedback的agentic框架来弥补用户意图与生成所需上下文之间的差距。 huggingface.co

一篇论文提出按系统拆解评测agent记忆 现有评测仍把agent记忆当黑箱、只看F1/BLEU等端到端指标，该论文主张把存储、检索、更新、整合、生命周期治理等环节拆开来评测agent的记忆系统。 huggingface.co