AI 基准组织因未及时披露与 OpenAI 资金相关的信息而受到外界的广泛批评和关注

近期,开发 AI 数学基准的非营利组织 Epoch AI 因未及时披露其获得 OpenAI 资金而引发争议。该组织于12月20日宣布,OpenAI 资助了名为 FrontierMath 的项目,这是一项旨在测试 AI 数学能力的基准,OpenAI 还利用该基准展示了其即将推出的旗舰 AI 产品 o3。

Epoch AI 的一名承包商在论坛 LessWrong 上使用昵称 “Meemi” 表示,许多参与 FrontierMath 项目的贡献者在 OpenAI 的资助被公开之前并不知情。他提到:“关于这一点的沟通缺乏透明度。在我看来,Epoch AI 应该提前披露 OpenAI 的资金来源,承包商也应当清楚他们的工作有可能被用于能力评估时,才能决定是否参与基准的开发。”

社交媒体上,一些用户对此表示担忧,认为这种保密行为可能损害 FrontierMath 作为客观基准的声誉。除了资助 FrontierMath 外,OpenAI 还对该基准中的许多问题和解决方案拥有可见性,而 Epoch AI 在12月20日之前并未对此进行披露。

斯坦福大学的数学博士生 Carina Hong 在社交平台上指出,OpenAI 因与 Epoch AI 的合作而获得了 FrontierMath 的优先访问权,这让一些贡献者感到不满。“六位对 FrontierMath 基准有显著贡献的数学家确认,他们并不知道 OpenAI 会独占这个基准,其他人将无法接触到。”Hong 表示,大多数贡献者在得知这一点后表示,如果早知道这一安排,他们可能不会参与该项目。

Epoch AI 副主任 Tamay Besiroglu 对此表示,虽然组织的透明度有所不足,但他认为 FrontierMath 的完整性并未受到影响。他承认,Epoch AI 在沟通上存在失误,未能提前告知贡献者 OpenAI 的参与情况。

Besiroglu 表示,虽然 OpenAI 有权访问 FrontierMath,但双方有 “口头协议”,OpenAI 不会使用该基准的问题集来训练其 AI。Epoch AI 还保留了一份 “单独的保留集”,以确保 FrontierMath 基准结果的独立验证。

Epoch AI 首席数学家 Ellot Glazer 在 Reddit 上提到,Epoch AI 尚未独立验证 OpenAI 的 FrontierMath o3结果。他认为 OpenAI 的得分是可信的,但在独立评估完成之前,无法对其进行确认。


划重点:

💡 Epoch AI 因未及时披露 OpenAI 资金而受到批评,导致一些贡献者感到不满。  

🔍 FrontierMath 基准的完整性受到质疑,OpenAI 在项目中获得了优先访问权。  

🔒 Epoch AI 承认沟通失误,但与 OpenAI 的合作仍保持透明的评估机制。  

猜你喜欢

古籍保护的十年历程:使古籍在新时代中焕发活力与传承价值
古籍保护的十年历程:使古籍在新时代中焕发活力与传承价值

古籍保护这十年:让古籍“活”起来传下去记者 刘彬【奋进新征程 建功新时代·伟大变革】草长莺飞,春风拂柳。这个春天,古籍修

在综艺舞台重现音乐剧魅力,实现“原汁原味”面临新的挑战
在综艺舞台重现音乐剧魅力,实现“原汁原味”面临新的挑战

东方卫视音乐剧类综艺《爱乐之都》开播,观众体验褒贬不一,专访演出业内人士揭秘拍摄技术音乐剧搬上综艺舞台,想“原汁原味”有

通过艺术的创新想象推动技术的无限创造力与灵感阀门开启
通过艺术的创新想象推动技术的无限创造力与灵感阀门开启

艺术想象力带动技术创造力(坚持“两创” 书写史诗)核心阅读舞美是一出戏内在精神的视觉体现。艺术想象力往往决定着作品的特点

梁晓声最新长篇小说深刻描绘80后在彷徨与坚守之间的心路历程与成长故事
梁晓声最新长篇小说深刻描绘80后在彷徨与坚守之间的心路历程与成长故事

本报讯(记者 李俐)在年初《人世间》爆火之后,茅盾文学奖得主梁晓声近日出版现实主义新长篇《中文桃李》,聚焦时代更迭之际青

新一届中国女排大名单正式发布!天津队球员三人成功入选引关注!
新一届中国女排大名单正式发布!天津队球员三人成功入选引关注!

据@人民日报体育 消息,新一届中国女排大名单公布。通知显示,共有20名运动员入选大名单。其中,天津女排的李盈莹、王媛媛、

古代人眼中的“科幻”宇宙:他们如何构建未来世界的幻想
古代人眼中的“科幻”宇宙:他们如何构建未来世界的幻想

我国最近不少航天科技的命名都与传统文化符号有关。如探月工程有“嫦娥”“玉兔”,探日工程有“羲和”,我国自建的导航系统叫“

中国古生物学家在临沂发现距今约5.04亿年的独特动物群遗迹
中国古生物学家在临沂发现距今约5.04亿年的独特动物群遗迹

中新网南京4月15日电 (记者 杨颜慈)据中国科学院南京地质古生物研究所15日消息,该所报道了来自中国华北地区的一处距今

关于明中都考古学研究的新进展与重要发现引发的关注
关于明中都考古学研究的新进展与重要发现引发的关注

明中都考古的新发现(考古中国)城市考古是考古学最重要的内容之一。明中都、明南京、明北京城是大明王朝先后营建的三座都城,南

终身专注于古代甲胄的修复与保养之道
终身专注于古代甲胄的修复与保养之道

一生致力古代甲胄修复(薪火相传)甘肃武威唐代吐谷浑王族墓葬群考古刚刚入选“2021年度全国十大考古新发现”。这项开始于2

2021年西藏加大文化基础设施建设力度 投资总额达到7700万元以促进文化发展
2021年西藏加大文化基础设施建设力度 投资总额达到7700万元以促进文化发展

中新网拉萨4月16日电(记者赵朗)西藏全区文化工作会议15日在拉萨召开。会议系统回顾总结了2021年全区文化工作,并对2