文章编号:10104时间:2024-09-30人气:
近日,国际顶尖科学学术期刊Nature刊登了一篇关于AI大模型“脑雾”现象的研究。
来自西班牙的研究团队发现,经过优化后的AI大模型虽然基本做到有问必答,但在面对超纲问题时,会出现错答、乱答的现象,导致生成结果的准确性和响应效率降低。
这一现象引发了人们对AI大模型可信度的担忧。
研究团队选择了三个有代表性的AI大模型作为研究对象,分别是openai的GPT、Meta的Llama以及BigScience研发的BLOOM模型。
经过数千次测试,研究人员发现,随着AI大模型的参数量增大、版本更新,其回答的准确度会有所提高。
但随着问题难度增加,其回答的准确度有所下降。
这一现象在GPT-4等AI大模型中尤为明显。
除了AI大模型本身存在的问题,该研究还发现人们通常也难以发现AI回答中的错误。
测试结果显示,人们误判AI大模型回答的频率高达10%到40%。
这意味着,用户可能会错信AI聊天机器人的说法,被混淆视听。
针对这一问题,研究者JoséHernández-Orallo提议,AI开发者应着重提升AI大模型在处理简单问题时的整体表现,并引导AI聊天机器人拒绝回答一些较为困难的问题。
他认为,人们需要懂得在哪个范围内适合使用AI,而在哪个范围内AI助手难以胜任工作。
对于超出阈值的问题,可以直接回复“我不知道”。
随着AI大模型的不断优化,包括更大的参数量、更多的训练数据和使用更多的算力等,其性能得到了显著提升。
研究团队发现,这些优化似乎也使得AI大模型的脑雾现象愈发严重。
尤其是采用强化学习等方式人为微调后的AI大模型版本,虽然生成答案的准确度有所提高,但错误率也在同步增加。
研究发现,一些原本选择逃避回答的问题,现在的AI大模型更倾向于给出一个错误答案来应付。
这使得这些模型出现脑雾情况的比例增加,反而变得更加不可靠。
哲学家MikeHicks将这种脑雾现象称为胡扯,即这些AI大模型越来越擅长不懂装懂。
这意味着当聊天的话题超出AI聊天机器人的知识储备时,它输出观点的倾向比过去更为明显。
为了降低脑雾频率,部分AI大模型已经采取了与设定阈值类似的方法。
它们遇到超出知识范围的问题后,会回答“我不知道”,或者“我没有足够的信息来解答这个问题”。
针对专业领域的AI聊天机器人,其回答机制通常更严谨,以免乱答超纲问题。
这在一定程度上降低了脑雾现象的出现。
AI大模型的脑雾现象对用户的判断力和信任度构成了挑战。
为了提升AI大模型的可靠性,研究者们呼吁开发者加强对简单问题的处理性能提升的同时,也需要警惕因过度优化而导致的脑雾现象加剧问题。
对于通用型AI聊天机器人来说,设定合理的阈值范围以避免误导用户同样重要。
未来,随着技术的不断进步和研究的深入,人们有望看到更为可靠、高效的AI大模型的出现。
上一篇:探讨AR眼镜行业发展趋势
内容声明:
1、本站收录的内容来源于大数据收集,版权归原网站所有!
2、本站收录的内容若侵害到您的利益,请联系我们进行删除处理!
3、本站不接受违法信息,如您发现违法内容,请联系我们进行举报处理!
4、本文地址:https://www.nazei.cn/shwz/ae414f6eb6f9805de144.html,复制请保留版权链接!
文章正文论身体平衡的热点切换与应急退烧之法在纷繁复杂的生活中,我们常常面临各种各样的健康挑战。有时候,身体的微妙平衡会因外在环境与内在因素的交互作用而被打破,导致身体过热或过冷的现象。对于这种现象,我在过去的多年实践中摸索出一套快速有效的应急与退烧之法。今日将其整理成文,分享给大家。一、身体的失衡与热点切换当身体出现不平衡状态,很容易...
互联资讯 2024-11-10 05:32:34
第七届进博会:跨国企业共享中国机遇的桥梁新华社北京11月4日电:一年一度的中国国际进口博览会即将拉开帷幕,这次盛会不仅是中国向世界展示开放与合作的平台,更是跨国企业共享中国发展机遇的重要桥梁。第七届进博会,注定成为一场精彩纷呈的盛宴,众多跨国企业翘首以待,期待在这片广阔的舞台上共同书写互惠互利、互相成就的进博故事。一、进博会:开放共赢...
互联资讯 2024-11-05 11:03:12
双十一年度大促与床垫选购攻略大家好,我是床垫课外书。今年双十一天猫购物狂欢即将来临,又到了换新床垫的好时机。众所周知,人生中约有三分之一的时间在床上度过,床垫品质对于睡眠质量及舒适度具有极大的影响。在此给大家梳理一些关于如何在有限预算下购买高性价比床垫的实用攻略。尤其对于那些在床垫选购上预算在两千至三千元的家庭来说,如何挑选一张品质上...
互联资讯 2024-11-02 08:51:37
富连成社:京剧第一科班的精神遗产与当代戏曲发展的启示它是戏曲史上的一段传奇,被誉为京剧的大师摇篮。创办至今已有120年历史,培养出众多京剧界巨星,如马连良、谭富英等。今天,我们纪念富连成社创办120周年,缅怀其崇高的艺术风范、不凡的艺术道路和杰出的艺术贡献。那么,这个传统科班对于当下戏曲界有哪些精神遗产?又给我们带来了哪些启示呢?一、...
互联资讯 2024-11-02 01:43:16
奋勇争先铸辉煌——见证中国奋斗的奇迹在广袤无垠的历史长河中,中华民族以其深沉而坚韧的奋斗精神,铸就了一个又一个辉煌的成就,如今的中国,犹如一颗璀璨的明珠,在世界的舞台上熠熠生辉,从高铁飞驰、大桥飞架、公路纵横,到国产大飞机翱翔天际,再到星际探索的壮丽画卷,中国正以其独特的姿态,向世界展示着中国力量的风采,一、崛起的交通强国中国高铁、中...。
互联资讯 2024-10-02 18:17:17
山东大学管理学院痛失杰出教授,刘冰博士英年早逝在九月的尾声里,山东大学管理学院迎来了一场令人痛心的噩耗,一位杰出的教授,一位才华横溢的博士生导师,刘冰同志,因病医治无效,于2024年9月29日20时55分在济南逝世,享年仅52岁,这个消息让全校师生深感震惊和悲痛,刘冰教授的离世是学术界、教育界以及他热爱的事业的一大损失,一、生平简介刘...。
互联资讯 2024-10-01 14:17:59
魔兽世界WLK怀旧服中的工作室脚本号现象解析魔兽世界WLK怀旧服自上线以来,一直受到广大玩家的热爱,随着游戏的持续运营,一些玩家开始遭遇到工作室脚本号的困扰,这些脚本号在野外打怪、采集、剥皮以及批量练级等行为,占据了热门资源点,严重影响了普通玩家的生存空间和游戏体验,关于这一问题,本文将详细探讨工作室脚本号现象的背后原因、玩家的困扰、...。
互联资讯 2024-09-30 13:53:09
商业性个人住房贷款利率定价机制完善后存量房贷利率调整解析近日,中国人民银行发布公告〔2024〕第11号,对商业性个人住房贷款利率定价机制进行了完善,这一政策调整对于广大房贷借款人来说,无疑是一项重要利好,公告主要进行了两大优化,接下来我们将详细解读这两大优化如何影响存量房贷利率,并探讨对借款人的实质影响,一、允许变更房贷利率在LPR基...。
互联资讯 2024-09-30 07:13:48
最后生还者,电视剧第二季先导预告解析及第一季剧情回顾感谢IT之家网友手写的线索投递!随着IT之家9月27日的消息传来,,最后生还者,电视剧第二季的先导预告已在昨日,9月26日,释出,该先导预告为我们重温了第一季中乔尔,Joel,和艾莉,Ellie,两位主人公的历程,并揭示了他们在乔尔做出命运抉择五年后的新故事,本文旨在解读第二季先导...。
互联资讯 2024-09-30 03:35:36
丧尸围城2,未来或有复刻,重制版,经典游戏的再次崛起未知笔名发表于2024年9月29日10点42分54秒在电子游戏的世界中,经典的回归总是让人兴奋不已,就在最近,,丧尸围城,豪华复刻版,的正式发售引发了广大游戏爱好者的热议,而更加令人振奋的消息是,据外媒gameranx报道,在接受Inverse采访时,开发团队成员提到了,丧尸围城2...。
互联资讯 2024-09-29 23:48:53
地平线,零之曙光重制版,——开启全新的游戏体验IT之家9月25日消息,一场备受瞩目的盛事在北京时间今日清晨揭晓,在9月StateofPlay活动中,索尼PlayStation带来了一项令人振奋的宣布——,地平线,零之曙光重制版,HorizonZeroDawnRemastered,即将于10月31日登陆PlayStation5和PC...。
互联资讯 2024-09-25 14:23:40