谷歌运用小型模型加快大型 AI 模型训练进程,实现效率提升达 28% 的新突破

近年来,训练大型语言模型(LLM)变得越来越昂贵且复杂,只有少数大型科技公司具备相应的计算资源。不过,谷歌最近推出了一种名为 SALT(小模型辅助大模型训练)的新方法,这一创新可能会彻底改变 AI 训练的格局。

机器人 人工智能 AI (4)

图源备注:图片由AI生成,图片授权服务商Midjourney

根据谷歌研究和 DeepMind 的最新研究论文,“一点帮助就能走得更远:通过利用小型语言模型实现高效的 LLM 训练”,SALT 引入了一种新的两阶段训练过程。这种方法不仅高效,而且更具实用性,改变了我们以往的训练方式。

SALT 的第一阶段是知识蒸馏。在这一阶段中,小型语言模型(SLM)充当教师,将其理解知识传递给更大的模型。小型模型通过 “软标签” 来分享其学习到的知识,帮助大型模型在学习的初期掌握基础概念。这个阶段尤其适用于小型模型在学习区域具有较强预测信心的 “简单” 任务。

第二阶段是自我监督学习。大型模型在这一阶段开始独立学习,专注于掌握更复杂的模式和挑战性任务。这个转变需要经过精心设计的策略,包括线性衰减和线性比例衰减,这确保了大型模型能够平稳过渡,逐步减少对小型模型的依赖。

谷歌研究人员在实验中发现,使用一个15亿参数的小型模型训练一个28亿参数的大型模型,在 “堆栈数据集” 上的训练时间缩短了28%。在经过微调后,大型模型在数学问题的准确率从31.84% 提升至34.87%,阅读理解的准确率也从63.7% 提高到67%。这种新方法不仅提升了训练效率,还在性能上取得了显著进步。

SALT 的出现有望降低 AI 开发的门槛,使得许多原本受限于资源的小型研究机构和公司也能参与到 AI 模型的开发中。研究和开发的机会将更加普及,可能会催生出更多独特和专业化的 AI 解决方案,带动相关领域的创新与应用。

划重点:

🌟 采用 SALT 方法可以将大型模型的训练时间缩短28%,极大降低了计算成本。

📈 使用小型模型进行知识蒸馏,能够显著提升大型模型在复杂任务上的表现。

🔍 SALT 的创新可能会降低 AI 开发的门槛,使得更多小型机构能够参与到 AI 研究中。

猜你喜欢

墨韵传递少年情怀,梦的起航——第四届福田区青少年书法大赛成功落幕
墨韵传递少年情怀,梦的起航——第四届福田区青少年书法大赛成功落幕

在庆祝中华人民共和国成立75周年的热烈氛围中,深圳市福田区近日成功举办了“少年梦·中国梦”——第四届青少年书法大赛颁奖仪

新时代书画艺术的展示与传承,携手筑梦之旅绽放中华文化的无限魅力!
新时代书画艺术的展示与传承,携手筑梦之旅绽放中华文化的无限魅力!

在中国国际教育电视台《闪耀中国》栏目,一场别开生面的艺术盛事——“筑梦新时代-当代书画名家视频展”正式拉开帷幕。此次展览

国画大家朱祖国:深入探索国画创新与发展的旅程,感受指墨山水艺术的新风貌与境界
国画大家朱祖国:深入探索国画创新与发展的旅程,感受指墨山水艺术的新风貌与境界

在当代中国画坛,朱祖国先生无疑是一位举足轻重的艺术大家。他以独特的艺术风格和深厚的笔墨功底,赢得了广泛赞誉。朱祖国,号樵

胡也佛书画传奇:苍劲之力尽显笔墨之间,隽逸山水之美令人神往!
胡也佛书画传奇:苍劲之力尽显笔墨之间,隽逸山水之美令人神往!

在艺术界,胡也佛是一个不可忽视的名字。他生于1908年,逝于1980年,本名国华,后改名为丁文、若佛,字大空,号谷华,自

李公麟的马之传说:一幅蕴藏1286匹骏马的国宝级画作,因其珍稀性被禁出国展览
李公麟的马之传说:一幅蕴藏1286匹骏马的国宝级画作,因其珍稀性被禁出国展览

在浩瀚的艺术长河中,有这样一位北宋时期的绘画巨匠,他的笔下不仅流淌着对自然的深情厚谊,更蕴藏着对生命的深刻洞察。这位大师

李渔为何对李流芳的画作情有独钟?深入揭秘《芥子园画传》范本选择背后的独特故事
李渔为何对李流芳的画作情有独钟?深入揭秘《芥子园画传》范本选择背后的独特故事

在筹划出版《芥子园画传》的过程中,李渔面临了一个重要的挑战:如何征集到高质量的稿件。这一任务不仅关乎书籍的品质,更直接影

董宇辉音乐会海外引发热潮,周年庆新节目将献上哪些意想不到的精彩内容?
董宇辉音乐会海外引发热潮,周年庆新节目将献上哪些意想不到的精彩内容?

董宇辉跨年音乐会余温未散,海外走红引热议近期,董宇辉的“跨年乐享音乐会”成为了大众热议的话题。这场于新年之初举办的音乐会

巴士变身舞台,成都街头快闪音乐剧《双面奇才》引燃热情与创意!
巴士变身舞台,成都街头快闪音乐剧《双面奇才》引燃热情与创意!

在成都的街头巷尾,一场别开生面的艺术盛宴悄然上演。近日,一辆装饰独特的双层巴士穿梭于城市的各个角落,搭载了近20位四川本

百万读者共同选出网络文学巅峰作品,二十部经典佳作共绘网络小说辉煌蓝图
百万读者共同选出网络文学巅峰作品,二十部经典佳作共绘网络小说辉煌蓝图

近期,网络文学界迎来了一次盛大的评选活动——2024网络文学“神作榜”在起点读书的精心组织下正式揭晓。《仙工开物》、《遮

刘黑木《残荷细语》:在冬日荷塘的水墨世界中探寻生命哲学与诗意的深邃表达
刘黑木《残荷细语》:在冬日荷塘的水墨世界中探寻生命哲学与诗意的深邃表达

近日,知名画家刘黑木推出了一系列名为《残荷细语》的冬日荷塘水墨作品,共计四十余幅,每幅作品均钤有他亲手篆刻的印章。这批作