智谱GLM-4-9B表现出色,其幻觉率仅为1.3%在全球大型模型评测中荣获第一名

在人工智能领域,大语言模型的"幻觉问题"一直是困扰业界的关键挑战。近日,一项基于HHEM-2.1-Open评估体系的测试结果显示,智谱AI旗下的GLM-4-9B模型交出了一份令人瞩目的成绩单。

测试数据显示,在参与评估的85个大语言模型中,GLM-4-9B以98.7%的事实一致性率和100%的回答率摘得桂冠。特别值得关注的是,该模型的幻觉率仅为1.3%,这一成绩不仅位居榜首,更是超越了行业巨头OpenAI的GPT系列和Google的Gemini系列模型。

机器人 元宇宙 科幻

图源备注:图片由AI生成,图片授权服务商Midjourney

这一突破性成果标志着中国大语言模型在降低"幻觉率"方面取得重要进展,为提升AI应用的可靠性和准确性带来新的可能。这不仅体现了智谱AI在模型研发上的技术实力,也为全球AI领域树立了新的标杆。

在当前AI技术竞争日益激烈的背景下,GLM-4-9B模型的出色表现无疑将为智谱AI赢得更多关注,同时也为中国AI企业在国际舞台上赢得了更多话语权。

猜你喜欢

第十二届北京国际电影节定于8月13日至20日拉开帷幕,精彩活动不容错过
第十二届北京国际电影节定于8月13日至20日拉开帷幕,精彩活动不容错过

第十二届北京国际电影节将于8月13日至20日举办【“天坛奖”评委会名单揭晓,李雪健担任主席;1450部国内外影片报名参评

姚明在篮球名人堂发表感言:回顾我们篮球发展的历史与源起
姚明在篮球名人堂发表感言:回顾我们篮球发展的历史与源起

“要知道我们从哪里来”【姚明谈篮球名人堂】目前,由中国篮协主导的中国篮球名人堂系列工作正在逐步推进。昨日,中国篮协主席姚

独自奔跑的篮球赛:缅怀不灭的灵魂,传承无尽的爱意
独自奔跑的篮球赛:缅怀不灭的灵魂,传承无尽的爱意

新华社长沙7月28日电 一个人的篮球队:逝者永生,爱在延续新华社记者帅才、黄凯莹、姚羽2017年4月27日,热爱篮球的少

四届F1世界冠军赛手维特尔确认将在本赛季结束后正式宣布退役的消息
四届F1世界冠军赛手维特尔确认将在本赛季结束后正式宣布退役的消息

北京7月28日电 世界一级方程式赛车锦标赛(F1)四届世界冠军塞巴斯蒂安·维特尔在个人社交媒体上宣布,将于2022赛季结

川籍书画艺术家携手“老川办” 共同举办捐赠活动 弘扬翰墨文化传承精神
川籍书画艺术家携手“老川办” 共同举办捐赠活动 弘扬翰墨文化传承精神

漫步在“老川办”,仿佛走进了一座书画博物馆,山水雄浑,翰墨飘香,每一幅作品都诉说着巴山蜀水的灵秀之美。7月29日,曾来德

国足在国际足联最新排名中保持亚洲第11位的成绩,面临挑战与机遇
国足在国际足联最新排名中保持亚洲第11位的成绩,面临挑战与机遇

凭借东亚杯末轮取胜中国香港队,中国队(国足选拔队)在本届赛事中累计获得2 07国际排名积分。不过令人遗憾的是,中国队仍以

《爱情的碎片:手史视角下的西方爱情意识演变与其中文译本的全新发布》
《爱情的碎片:手史视角下的西方爱情意识演变与其中文译本的全新发布》

30日晚,“爱情的背面——欧洲史上的分手之困”的读书沙龙和直播活动在北京举行。中国环境出版集团供图北京7月31日电 (记

国家版本馆中央总馆六大展览同步开放,展示上万件珍贵展品引人瞩目
国家版本馆中央总馆六大展览同步开放,展示上万件珍贵展品引人瞩目

走进位于国家版本馆主建筑文华堂的国家书房,抬头就能看到宋代石刻天文图的星空穹顶。 本报记者 潘之望摄30日,中国国家版本

斯巴达儿童赛全国总决赛热火朝天 小勇士们奋力争夺前往世锦赛的资格
斯巴达儿童赛全国总决赛热火朝天 小勇士们奋力争夺前往世锦赛的资格

小选手在比赛中。组委会供图北京8月1日电 记者从赛事组委会获悉,7月30日-31日,2022长安福特斯巴达勇士儿童赛崇礼

2022年度北京市级社会足球赛事正式启动 活动将持续进行至12月,期待市民积极参与
2022年度北京市级社会足球赛事正式启动 活动将持续进行至12月,期待市民积极参与

北京8月1日电(记者 卞立群)7月31日晚,2022年北京市市级社会足球活动启动仪式在朝阳区首开望京体育园举办,启动仪式