研究报告指出:AI模型只需受到0.001%的虚假数据影响便可陷入失效状态

近期,纽约大学的研究团队发表了一项研究,揭示了大规模语言模型(LLM)在数据训练中的脆弱性。他们发现,即使是极少量的虚假信息,只需占训练数据的0.001%,就能导致整个模型出现重大错误。这一发现对于医疗领域尤其引人关注,因为错误的信息可能直接影响患者的安全。

代码 互联网  (2)

图源备注:图片由AI生成,图片授权服务商Midjourney

研究人员在《自然医学》杂志上发表的论文中指出,虽然 LLM 表现出色,但如果其训练数据中被注入了虚假信息,这些模型依然可能在一些开放源代码的评估基准上表现得与未受影响的模型一样好。这意味着,在常规测试下,我们可能无法察觉到这些模型潜在的风险。

为了验证这一点,研究团队对一个名为 “The Pile” 的训练数据集进行了实验,他们在其中故意加入了150,000篇 AI 生成的医疗虚假文章。仅用24小时,他们就生成了这些内容,研究表明,给数据集替换0.001% 的内容,即使是一个小小的1百万个训练标记,也能导致有害内容增加4.8%。这个过程的成本极其低廉,仅花费了5美元。

这种数据中毒攻击不需要直接接触模型的权重,而是攻击者只需在网络上发布有害信息,就能削弱 LLM 的有效性。研究团队强调,这一发现凸显了在医疗领域使用 AI 工具时存在的重大风险。与此同时,他们也提到,已经有相关案例显示,某些 AI 医疗平台,例如 MyChart,在自动回复患者问题时,常常会生成错误的信息,给患者带来困扰。

因此,研究人员呼吁 AI 开发者和医疗提供者在开发医疗 LLM 时,必须清楚认识到这一脆弱性。他们建议,在未来能够确保安全性之前,不应将 LLM 用于诊断或治疗等关键任务。

划重点:

🌐 研究表明,仅需0.001% 的虚假信息,就能让大规模语言模型(LLM)失效。  

🩺 医疗领域中,虚假信息的传播可能严重影响患者安全。  

💡 研究人员呼吁在确保安全之前,不应将 LLM 用于诊断或治疗等重要医疗任务。

猜你喜欢

“中国影像节”盛大开启全球展映活动,展示丰富多元的中国影视文化
“中国影像节”盛大开启全球展映活动,展示丰富多元的中国影视文化

“中国影像节”全球展映活动开幕央视供图北京6月21日电 (记者 高凯)21日,首届由中央广播电视总台与文化和旅游部联合举

邓拓捐献的古代绘画珍品展正式在中国美术馆开幕,珍藏艺术启迪观众
邓拓捐献的古代绘画珍品展正式在中国美术馆开幕,珍藏艺术启迪观众

展厅现场中国美术馆供图北京6月22日电 (记者 应妮)“清节迈多士,斯文传古风”。由中国美术馆精心策划并主办的“斯文传古

河北沧州民间艺术家精心打造刻瓷博物馆 努力传承与保护非物质文化遗产
河北沧州民间艺术家精心打造刻瓷博物馆 努力传承与保护非物质文化遗产

图为今年二月,侯汉鹏(右二)在刻瓷博物馆里向游客讲解刻瓷作品。李世文摄沧州6月22日电 (记者 王天译)“打造刻瓷博物馆

探索俄罗斯国立图书馆的文化魅力与历史底蕴
探索俄罗斯国立图书馆的文化魅力与历史底蕴

品味俄罗斯国立图书馆(阅读时光)博尔赫斯曾在《关于天赐的诗》中写下了这样的诗句:“如果有天堂,那应是图书馆的模样。”是啊

《梦华录》通过男女真实情感的表现揭示了特权美学的深层次内涵与社会反思
《梦华录》通过男女真实情感的表现揭示了特权美学的深层次内涵与社会反思

“行事不似平民世俗女子,原来是官宦之后。”《梦华录》火了,《梦华录》好在哪?有人说它传达了“宋韵”,但剧中浓妆艳抹、富贵

《中国说唱巅峰对决》正式宣布定档于6月25日,期待无与伦比的音乐盛宴!
《中国说唱巅峰对决》正式宣布定档于6月25日,期待无与伦比的音乐盛宴!

MC HotDog热狗不做导师要参赛、六位说唱冠军大乱斗,《中国说唱巅峰对决》迎来定档。华语乐坛说唱歌手顶级联赛《中国说

一位热爱学习汉语的小朋友在语言学习旅程中的快乐与成长
一位热爱学习汉语的小朋友在语言学习旅程中的快乐与成长

马晓飞是我的学生,是我所任教的语言学校汉语班的一名特殊学生。我居住在斯洛伐克第二大城市科希策,人口不足30万。我在国立语

中国花游队在世锦赛上再创佳绩,成功夺得第四枚金牌
中国花游队在世锦赛上再创佳绩,成功夺得第四枚金牌

来源标题:中国花游夺世锦赛第四金北京时间6月24日晚,在第19届国际泳联世锦赛花样游泳集体自由自选决赛中,8位中国姑娘凭

在中国男排世联赛中,中国队遗憾不敌阿根廷队,无缘胜利
在中国男排世联赛中,中国队遗憾不敌阿根廷队,无缘胜利

来源标题:中国男排世联赛不敌阿根廷队北京时间6月24日,在2022年世界男排联赛菲律宾奎松站比赛中,中国男排虽打出自身特

中外专家齐聚孔孟故里 探讨全球文化旅游名城建设的新机遇与发展方向
中外专家齐聚孔孟故里 探讨全球文化旅游名城建设的新机遇与发展方向

6月26日,2022世界文化旅游名城济宁(曲阜)论坛在曲阜开幕。杨国庆摄山东曲阜6月26日电 (记者 沙见龙)2022世