Artisan广告牌盗用「这没事」狗,作者KC Green:他们从没联系我

01「这没事」狗被印上「停雇人类」广告牌,原作者KC Green说Artisan从没联系过他

漫画家KC Green上周刷推特,看到一张让他愣住的广告牌:那只在火焰里说「这没事」的狗,被印在硅谷AI公司Artisan的「停止招聘人类」广告上。他没授权过这张图,对方也从没联系过他。

Artisan是做AI销售agent的初创公司,主打「让人类休息,让AI工作」。过去一年它在Caltrain车站和湾区高速边竖了大批广告牌。这次他们挑中的,恰好是过去十年互联网最知名的「面对一切失控仍假装平静」的符号。Green过去碰到盗用,通常发条推自嘲一下了事,这次他换了说法:「我打算找律师。」

Green不是孤例。同一周,Spotify给真人艺人上线了认证徽章,用来证明唱歌的不是AI。AI生成的音乐正大量涌入流媒体平台,一些AI「乐队」累积了数百万次播放,平台此前没有任何办法告诉听众这首歌是不是人写的。新徽章不过滤AI内容,只是在真人主页上挂一个「这是真人」的标签。

截至发稿,Artisan未公开回应是否会撤下广告。Caltrain车站那块「停止招聘人类」的广告牌,还在。

创作者维权门槛从「发条推抱怨」抬到「准备起诉」流媒体平台开始把「真人」做成认证标识AI公司用未授权作品营销「取代创作者」的服务,成本仍接近零

02GPT-5.5追平Mythos网络安全分数同周,开源Kimi K2.6在编程榜跑赢三家闭源旗舰

Ars Technica在一组新的网络安全任务上复测了几款主流模型。GPT-5.5的得分追平了Mythos。Anthropic上月发布这款模型时,把网络安全能力做成了核心卖点,主导这次测试的研究者把结论摆得很直白:这不是某个模型独有的突破。

更紧的压力来自另一头。开源权重的Kimi K2.6在一项编程挑战上跑赢了Claude、GPT-5.5和Gemini三家闭源旗舰。这不是写作或推理那种打分主观的评估,是有标准答案的硬基准。

两端同时收紧。一边是闭源lab互相之间的能力差距被第三方复测抹平,「独家突破」需要同行验证才成立;另一边是开源权重在硬指标上追了上来。Kimi K2.6的权重已经放上Hugging Face,开发者下载部署不需要付调用费用。

闭源旗舰的「独家能力」宣传需要第三方复测验证开发者选模型的成本门槛被开源权重重新定价前沿模型从发布到被追平不到一个月

03同一个模型急诊诊断比两位医生还准,调成「照顾病人感受」后错误率反而升

哈佛上周把大语言模型扔进真实急诊病例测试。至少一个模型的诊断比两位人类医生联合判断更准——临床AI第一次在真实急诊数据上拿到这种结果。

同一周另一组研究公布了反向发现:把模型微调成「考虑用户情绪」、说话更体贴的版本后,准确率随即下降。研究者称之为「过度调教」,结论是模型开始「把用户满意度凌驾于真实性之上」。

医院部署AI被逼到一个具体的取舍:技术上模型确实比两位医生联合判断还准,但产品团队一旦为了让患者体验更好、把它调成更温和的对话风格,临床价值就开始往下掉。冷的版本最准,暖的版本最受欢迎,同一个模型兼顾不了。

研究者的建议是把诊断辅助和患者沟通分开部署:前者保留原始模型,后者用调教过的版本。医院采购时得明确知道自己买的是哪一个。

医院采购AI需区分诊断版与对话版调教模型讨好患者会损失诊断准确率同一模型无法兼顾真实性和讨好度
04

开发者把spec写成YAML对抗「AI psychosis」 博客作者acai在文章中提出「specsmaxxing」的工作流:把功能规格写成结构化YAML文件喂给模型,以减少长上下文里反复跑偏、产出失控的问题。帖子在Hacker News上引发关于AI辅助开发是否需要更严格输入约束的讨论。 acai.sh

05

一只松鼠拍鸟应用DualShot Recorder上线12小时冲到App Store付费榜第一 TikTok上以「松鼠爸爸」走红的Derrick Downey Jr.推出iPhone相机应用DualShot Recorder,可同时录主摄和自拍画面。上线半天登顶付费榜,创作者从内容博主转身做工具的路径再添一个样本。 theverge.com

06

MIT Tech Review EmTech AI圆桌:企业开始把数据从云厂商手里收回 会议讨论企业如何用「AI工厂」模式自建数据与模型管道,平衡数据主权与跨组织协作。与会者把焦点放在治理框架而非模型能力,反映大客户采购AI时的优先级正在转向数据归属。 technologyreview.com