成本低于50美元!科学家成功开发AI推理模型s1,性能可与OpenAI的o1相媲美

近期,斯坦福大学和华盛顿大学的 AI 研究人员成功训练出了一款名为 s1的 AI 推理模型,训练成本不足50美元,所需的云计算信用额度也非常低。这项研究成果于上周五发布,表明 s1在数学和编程能力测试上表现不逊于 OpenAI 的 o1模型和 DeepSeek 的 R1模型。s1的代码和数据已在 GitHub 上公开,供其他研究者使用。

image.png

研究团队表示,他们从一个现成的基础模型出发,通过蒸馏技术进行微调,以提取出所需的推理能力。s1的蒸馏过程使用了谷歌的 Gemini2.0Flash Thinking Experimental 模型,这种方法与加州大学伯克利分校的研究人员上个月训练另一款 AI 推理模型时采用的方式相似,后者的训练成本约为450美元。

这一成果让许多人感到振奋,尤其是在如今的 AI 领域,研究者们能够在没有巨额资金支持的情况下仍能进行创新。然而,s1的出现也引发了对 AI 模型商品化的深思。若任何人都可以以相对较低的成本复制出多百万美元的模型,那么这些大公司的护城河究竟在哪里呢?

显然,大型 AI 实验室对此并不满意,OpenAI 曾指控 DeepSeek 不当使用其 API 数据进行模型蒸馏。s1的研究团队希望能找到一种简单的方法来实现强大的推理性能,同时提升 “测试时间扩展” 能力,即让 AI 模型在回答问题之前有更多思考时间。这些都是 OpenAI 的 o1模型所取得的突破,DeepSeek 及其他 AI 实验室也尝试用不同的方法进行复制。

s1的研究表明,通过一个相对小的数据集,使用监督微调 (SFT) 方法可以有效蒸馏推理模型,而这种方法通常比 DeepSeek 采用的大规模强化学习方法更便宜。谷歌也提供了对 Gemini2.0Flash Thinking Experimental 的免费访问,但该平台有每日使用限制,并且其条款禁止逆向工程其模型以开发竞争服务。

为了训练 s1,研究人员构建了一个包含1000个经过精心挑选的问题及其对应答案的数据集,同时附上了问题背后的 “思考” 过程。训练过程使用了16个 Nvidia H100GPU,耗时不足30分钟。根据研究人员的介绍,他们如今只需约20美元就能租到所需的计算资源。此外,研究团队还使用了一个巧妙的技巧,让 s1在推理时添加 “等待” 一词,从而提升答案的准确性。

在未来的2025年,Meta、谷歌和微软计划在 AI 基础设施上投资数千亿美元,其中部分资金将用于训练下一代 AI 模型。尽管蒸馏技术在以较低成本再现 AI 模型的能力上展现出良好效果,但它并没有显著提升新的 AI 模型的表现。

论文:https://arxiv.org/pdf/2501.19393

代码:https://github.com/simplescaling/s1

划重点:  

🌟 s1模型的训练成本不足50美元,表现媲美顶尖推理模型。  

🛠️ 研究团队通过蒸馏技术,从现成模型中提取推理能力,训练过程快速高效。  

🚀 大型 AI 实验室对低成本复制模型的情况表示担忧,未来投资将集中在 AI 基础设施上。

猜你喜欢

春日阅读的盛况!南通崇川区“阅·音乐LiVE”活动隆重开启,带你沉浸书海与乐音交织的魅力世界
春日阅读的盛况!南通崇川区“阅·音乐LiVE”活动隆重开启,带你沉浸书海与乐音交织的魅力世界

在第30个世界读书日即将到来之际,南通市崇川区举办了一场别开生面的全民阅读推广活动,为春日阅读增添了一抹独特的色彩。4月

圆明园遗韵:清代陈枚《山水楼阁图册》中的东方美学极致体现与文化回顾
圆明园遗韵:清代陈枚《山水楼阁图册》中的东方美学极致体现与文化回顾

在东方园林艺术的璀璨星河中,18世纪的圆明园无疑是最为耀眼的明珠之一。而提及圆明园,便不得不提清代画家陈枚的杰出作品——

常波国画“鸿运当头鲤鱼”:在笔墨中展现吉祥与灵动之美的独特魅力与深邃意境
常波国画“鸿运当头鲤鱼”:在笔墨中展现吉祥与灵动之美的独特魅力与深邃意境

在当代国画艺术的璀璨星河中,常波以其“鸿运当头鲤鱼”系列作品脱颖而出,犹如一颗耀眼的星辰,以其深厚的文化底蕴和独特的艺术

放大古今艺术的魅力,蒙娜丽莎神秘的微笑与中国老农的欢快歌声在画作中交织
放大古今艺术的魅力,蒙娜丽莎神秘的微笑与中国老农的欢快歌声在画作中交织

在欣赏艺术品的微妙之处时,细节往往成为决定作品成败的关键。尤其是名画,其细节不仅体现了艺术家的匠心独运,还往往隐藏着背后

华一民书法艺术展再展风采,2025兰亭杯金奖荣耀续写传奇
华一民书法艺术展再展风采,2025兰亭杯金奖荣耀续写传奇

在书法艺术的浩瀚星空中,又一颗璀璨之星悄然升起。华一民,这位来自江苏无锡却在浙江杭州诞生的艺术家,如今在重庆南岸区安享晚

瑞安花木传奇:古茶花傲视群芳,铁树涅槃重生,大榕树勇抗日敌展现强大生命力
瑞安花木传奇:古茶花傲视群芳,铁树涅槃重生,大榕树勇抗日敌展现强大生命力

瑞安春色正浓,踏青赏花正当时。这座位于东南沿海的城市,因其温润的气候和充沛的雨水,孕育了众多奇花异卉,成为春日里一道亮丽

古代官府如何运用抽象画像和通缉令迅速定位和捕捉逃犯?
古代官府如何运用抽象画像和通缉令迅速定位和捕捉逃犯?

古代通缉令画像抽象,却为何总能迅速捉拿犯人?这一历史谜团近日被揭开。在古代,官府发布的通缉令上,犯人的画像往往十分抽象,

“光影朝阳”职工摄影大赛:捕捉城市动人时刻,你的佳作是否被评选为优秀作品?
“光影朝阳”职工摄影大赛:捕捉城市动人时刻,你的佳作是否被评选为优秀作品?

“美丽朝阳·奋斗朝阳·幸福朝阳”全市职工随手拍摄影展活动正如火如荼地进行中,吸引了众多摄影爱好者和职工的积极参与。此次活

古代通缉令为何能通过模糊画像成功抓捕嫌犯?深度解析其背后的智慧与制度安排
古代通缉令为何能通过模糊画像成功抓捕嫌犯?深度解析其背后的智慧与制度安排

标题:揭秘古代衙门高效办案背后的智慧步入21世纪,信息科技为我们的日常生活带来了翻天覆地的变化,也为执法机构提供了前所未

樊芳儿在书画艺术领域展现卓越才华,荣获“人民书画家”殊荣,成就令人瞩目
樊芳儿在书画艺术领域展现卓越才华,荣获“人民书画家”殊荣,成就令人瞩目

在书画艺术领域,一位杰出艺术家的名字——樊芳儿,因其卓越成就与广泛影响力,近日被授予“人民书画家”的崇高荣誉。这一决定由