01llama.cpp并入Hugging Face,本地AI基础设施告别「单人维护」时代
三年前,保加利亚开发者Gerganov用C++写了一个能在消费级硬件上跑大模型的推理引擎。项目叫llama.cpp。如今它积累了9.55万颗星标,在GitHub上排名前列,被嵌进了数不清的产品和工具链。2月20日,他宣布整个团队加入Hugging Face。
驱动这个决定的不是收购,而是可持续性。项目的底层张量库叫ggml,由一个小团队维护,却支撑着全球数百万用户的本地AI部署。仓库里积压着403个未关闭的issue和716个待审的PR,对核心团队来说已经到了临界点。Gerganov在公告中写道,加入是为了「保障本地AI的长期进展」。
Hugging Face并非外来者。合并之前,它的工程师已经为llama.cpp贡献了多模态支持和多个模型架构的实现。公告称项目保持100%开源,技术决策仍由原团队自主做出。这次并入更像是把一段已有的协作关系正式化。
同一天,加拿大创业公司Taalas公布了第一款产品:一块将80亿参数大模型直接烧进定制芯片的推理硬件,跑出每秒17000个token的速度,约为当前主流方案的10倍。芯片不需要高带宽内存,不需要液冷,制造成本是传统方案的二十分之一。这家24人团队花了两年半,从2亿美元融资中拿出3000万美元做出了这个原型。
02AI编程工具搞瘫AWS十三小时,亚马逊称「怪人不怪AI」
去年12月,亚马逊的AI编程工具Kiro接到一个任务:修复云成本管理工具的一个小故障。Kiro自行判断最佳方案是「删除并重建整个环境」,直接搞瘫了中国大陆部分区域的AWS服务,中断持续13小时。
亚马逊将事故归咎于人。公司称涉事工程师给了Kiro过高的操作权限,这是「权限控制问题,不是AI自主性问题」。Kiro本应在每次操作前请求人工授权,但那位工程师把自己的权限直接交给了它。
多名匿名员工向《金融时报》给出了不同版本。一位资深员工称,这已是近几个月AI工具造成的第二次生产事故。「工程师让AI代理自行解决问题,不加干预。事故不大,但完全可以预见。」
亚马逊坚称AI的介入只是「巧合」,换成任何开发工具都可能出同样的问题。但事故之后AWS才补上了强制同行评审等安全措施,而亚马逊内部正严格追踪一个目标:80%的开发者每周至少用一次AI编程工具。
03xAI为游戏攻略调走高级工程师,微软教人用盗版书训练AI——扩张速度正在碾压内控
AI大公司对外讲的是技术路线图和安全承诺,对内跑的却是另一套逻辑。过去一周两起事件指向同一个结构性问题:治理机制跟不上扩张速度。
xAI将多名高级工程师从正式项目中抽调,转去优化自家聊天机器人回答《博德之门3》的能力。Business Insider的报道显示,这并非路线图上的任务,而是领导层个人偏好直接改写了资源分配。
同一周,微软在官方博客发布了一份AI训练指南,示例数据集用的是盗版《哈利·波特》,且被「误标」为公共领域作品。文章上线后才被发现并紧急删除,微软称属于「错误」。

Nvidia与OpenAI放弃未完成的千亿美元交易,转向300亿美元投资方案 双方此前推进的1000亿美元交易未能达成,改以300亿美元投资替代。 ft.com
OpenAI首款硬件产品曝光:带摄像头的智能音箱,售价200至300美元 据The Information报道,该设备能识别桌面物品和周围对话,搭载FaceTime级摄像头。这将是OpenAI首次发售ChatGPT硬件。 theverge.com
特朗普废除燃煤电厂汞排放标准,恰逢AI数据中心推高电力需求 特朗普政府撤销了拜登时期的「汞与空气有毒物质标准」(MATS),该标准主要约束燃煤电厂排放。撤销时点正值美国因AI数据中心建设用电量持续上升。 theverge.com
两个亲AI超级PAC在纽约国会选举中对决,Anthropic资助方为候选人站台 纽约国会候选人Alex Bores成为焦点——他提出的RAISE法案要求AI开发者披露安全协议并报告严重系统滥用。一个AI超级PAC攻击他,Anthropic资助的团体则为其背书。 techcrunch.com
OpenAI披露印度用户画像:18至24岁占消息量近50%,30岁以下占80% OpenAI称印度是ChatGPT增长最快的市场之一,年轻用户构成绝对主力。 techcrunch.com
OpenAI向First Proof数学挑战提交AI证明 OpenAI公开了模型在First Proof竞赛中的证明尝试,该竞赛测试AI在专家级数学问题上的研究型推理能力。 openai.com
《玩具总动员5》以AI玩具为反派:「我一直在听」 皮克斯新片中,AI平板和智能玩具入侵童年成为核心冲突。影片定于6月19日上映。 techcrunch.com
AI降低独立电影门槛,但创作者担忧低质内容涌入 AI工具让资源有限的电影人能更快更便宜地完成制作,但当效率成为行业首要标准,大量低投入AI生成内容可能淹没市场。 techcrunch.com
GUI-Owl-1.5发布:跨桌面、手机、浏览器的开源GUI代理模型 该模型提供2B至235B共五种规格,在OSWorld、AndroidWorld、WebArena等20余项基准上取得开源模型最佳成绩,支持云端协作与实时交互。 huggingface.co
InScope融资1450万美元,用AI自动化财务报表编制 公司由Flexport、Miro等企业的前会计师创办,专攻财务报表准备流程的自动化。 techcrunch.com