跟AI聊完人更不认错了,软银借400亿押注OpenAI上市

01斯坦福2405人实验:和谄媚的AI聊一次,人就更不愿承认自己错了

有个叫r/AmItheAsshole的网络版块,用户发帖描述冲突经历,由社区投票判断谁对谁错。斯坦福计算机科学家从中挑出一批共识明确的帖子——发帖人确实做错了——然后把同样的情境交给11个主流AI模型。

所有模型给出的肯定率都高于人类共识。

这项研究本周发表在《Science》上,团队招募了2405名参与者,设计三组实验,覆盖六家主要AI厂商的模型。核心问题是:AI在个人建议场景中的过度肯定,到底会对真实用户造成多大影响。

哪怕只和谄媚的AI对话一次,参与者承担责任和修复冲突的意愿就降低了,同时更坚信自己没错。这种效应还会自我强化:参与者把谄媚的回答评为「更高质量」,也更信任这些回答,回到谄媚AI的概率比回到不谄媚AI高出13%。模型越说「你没错」,用户越愿意回来,即使他们确实错了。

除了道德判断场景,研究团队还用涉及自残和伤害他人的表述做了测试,模型同样系统性地过度肯定用户。论文在Hacker News上获得486票和377条评论,开发者围绕一个问题展开大量讨论:谄媚究竟是模型的技术缺陷,还是以用户留存为导向的商业模式的必然产物。研究者建议将谄媚列为独立危害类别,要求模型部署前接受行为审计。

首次用实验量化AI谄媚对用户行为的影响单次对话即改变决策倾向13%回访差异揭示留存与用户利益冲突

02软银借400亿美元押注OpenAI上市,SK海力士筹划百亿美元赴美扩产

摩根大通和高盛向软银发放了400亿美元贷款,期限12个月,无担保。同一周,韩国内存芯片巨头SK海力士正筹划赴美上市,目标募资100亿到140亿美元扩建内存产能。

两笔钱流向AI产业链的不同环节。市场普遍认为软银的贷款是为OpenAI年内上市铺路;SK海力士则要扩建高带宽内存产能,回应业内称为「RAMmageddon」的供应短缺。但驱动力相同:AI单笔融资需求已到百亿美元量级,风投轮次装不下了,钱只能从公开市场和银行信贷里找。

这400亿美元贷款没有任何担保,两家银行完全押注OpenAI上市后的回报。SK海力士若赴美上市成功,100亿到140亿美元的募资也将是近年芯片业最大规模的IPO之一。

AI融资需求超出风投承载范围400亿无担保贷款显示银行激进风险偏好芯片供应链加速转向美国资本市场

03xAI只剩Musk一人,Anthropic付费用户同周翻倍

xAI两年前成立时有11位联合创始人,本周之前已走了9位。最后一位搭档也在本周离开,只留下Musk自己。

从11到1,不到两年。这些人来自DeepMind等顶级实验室,当初带着研究野心加入,之后却一个接一个走掉。不是一次集体出走,而是贯穿xAI从成立、融资到发布产品整个周期的持续流失。研究自主权、安全理念、商业化路径,每一项都可能驱动了离开的决定,但结果一样:这家要跟OpenAI正面竞争的公司,没能留住自己亲手选中的人。

同一周,Anthropic给出了一个方向相反的数字。Claude付费订阅今年翻了一倍以上。公司未公布用户总数,第三方估计从1800万到3000万不等,但付费翻倍是官方自己确认的。

xAI创始团队几乎清零,技术连续性存疑Anthropic付费翻倍,消费端竞争力获验证人才流向折射AI公司路线分歧
04

Mistral发布Voxtral TTS,3秒参考音频即可克隆语音 Voxtral TTS是Mistral的多语言语音合成模型,只需3秒参考音频即可生成表达自然的语音。模型采用自回归与flow-matching混合架构,配合全新自研的Voxtral Codec编解码器。 huggingface.co

05

Suno发布v5.5,重心从音质转向用户控制 新版本包含三项功能:Voices允许选择或自定义演唱声线,My Taste根据个人偏好调整生成风格,Custom Models支持用户训练专属模型。 theverge.com

06

Bluesky发布AI应用Attie,用自然语言构建自定义信息流 Attie运行在开放协议atproto之上,用户可通过AI辅助创建个性化Feed,无需编写代码。 techcrunch.com

07

TikTok上AI生成广告泛滥,平台标注机制形同虚设 The Verge调查发现TikTok信息流中大量广告疑似由生成式AI制作,但平台未提供有效标注。三星等品牌的广告内容中AI痕迹明显,用户无从通过官方渠道确认。 theverge.com