文章编号:19487时间:2024-10-17人气:
随着人工智能(AI)技术的飞速发展,大型语言模型(LLM)的推理过程逐渐引起了人们的关注。
近期,来自MetaFAIR团队的田渊栋等人的一项创新研究为我们揭示了如何从人类认知理论中汲取灵感,研发出一种名为Dualformer的新型Transformer架构,该架构能显著提升AI的推理能力。
近期的研究表明,人类的思考过程受到两个系统的控制:系统1和系统2。
系统1涉及快速、直觉性的思考,而系统2则涉及更为复杂、慢节奏的推理过程。
尽管大型语言模型已经在许多任务上取得了显著成果,但它们往往无法有效地结合这两种思考模式。
田渊栋团队从这一人类认知理论中获得灵感,提出了一种新型的解决方案。
为了模拟人类的系统2推理过程,田渊栋团队设计了一种新型的Transformer架构——Dualformer。
该架构允许用户在推理过程中指定使用快速或慢速模式,或者由模型自行决定。
在研究中,他们借鉴了A算法寻找最短路径的思想,并训练一个Transformer来建模表示规划任务的token序列。
为了模拟系统2推理过程,他们在包含推理轨迹和最终解答的数据上进行训练。
利用推理步骤的结构,他们设计了特定的轨迹丢弃策略,使得生成的轨迹类似于系统1在思考过程中采取的捷径。
在训练过程中,他们的策略是随机选择这些结构化的轨迹丢弃策略。
为了验证Dualformer的有效性,田渊栋团队进行了一系列实验。实验目标包括解答以下三个问题:
1. Dualformer在快速、慢速和自动模式下的表现是否优于相应的基线?
2. 在慢速模式下,Dualformer是否能实现更快的推理,即输出更短的轨迹?
3. 结构化的轨迹丢弃技术是否适用于在自然语言数据集上训练的LLM?
实验结果显示,Dualformer在生成正确和最优规划方面明显优于基线。
尤其在更大的迷宫问题中,Dualformer的优势更为明显。
Dualformer还能稳定地生成更多样化的规划,证明了其稳健性。
在实验过程中,他们还发现Dualformer可以轻松地通过提示词指定以快速或慢速生成模式运行。
在标准提示词之后添加一个bos和一个控制token,即可轻松控制Dualformer的运行模式。
这种控制机制非常简单,使得Dualformer具有非常吸引人的特性。
除了迷宫和推箱子任务外,田渊栋团队还将Dualformer应用到了数学推理任务中。
他们使用包含各种数学问题和答案的数据集对Llama-3-8B和Mistral-7B模型进行微调。
实验结果表明,使用轨迹丢弃技术和随机训练策略的模型更加有效和高效。
这一发现为大型语言模型在数学推理任务中的应用提供了新的可能性。
田渊栋团队的这项研究为我们提供了一种新型的思考模式,通过结合人类认知理论中的系统1和系统2思考模式,开发出一种高效的AI推理架构。
Dualformer的出现将为AI领域带来新的突破,使得AI能够更好地模拟人类的思考过程,从而解决更为复杂的问题。
上一篇:究竟是何大事引发各界瞩目?
内容声明:
1、本站收录的内容来源于大数据收集,版权归原网站所有!
2、本站收录的内容若侵害到您的利益,请联系我们进行删除处理!
3、本站不接受违法信息,如您发现违法内容,请联系我们进行举报处理!
4、本文地址:https://www.nazei.cn/shwz/a16efaf905418fad785b.html,复制请保留版权链接!
福特汽车第三季度财报公布,表现稳健并实现连续增长在近日,全球知名的汽车制造商福特汽车公布了XXXX年第三季度的财务报告。报告显示,公司在各项业务单元的营收增长,以及利润和现金流的强劲表现,显示出福特汽车的稳健发展和强劲势头。一、营收增长概况根据财报数据,福特汽车在XXXX年第三季度的营收达到了460亿美元。这是公司连续十个季度实现同比...
电影视频 2024-10-30 01:44:25
互联网时代的声浪与个体应对之道随着互联网的普及,我们生活的世界正在迅速缩小。过去我们很少能听到不同的声音,身边的人与我们持有相近的三观,但在信息爆炸的今天,我们可以轻易地接触到各种各样的观点和声音。无论是论坛、博客还是社交媒体平台,不同的声音如雨后春笋般涌现,使得个体不得不面对多元化的观点和争议。面对这些声浪,个体应该如何应对呢?这是...
电影视频 2024-10-17 11:02:44
《正常接触》:人与人的距离在混沌时代的描绘王占黑的全新小说集《正常接触》将于XXXX年X月面世,书中收录了六篇发生在社会失序背景下的中短篇小说。这部作品中的人物大都是普通人,他们在公共事件中遭遇各种困境,被迫分隔开,但在不经意间通过共同的记忆和短暂的互动,创造出充满生命印迹的时刻。这部作品试图勾勒在一个无法定义的时间和空间里,人与人的...
电影视频 2024-10-14 16:11:47
全球附加板,AIB,显卡市场展望,2024年第2季度的现状与未来IT之家9月25日消息,根据市场调查机构JonPeddieResearch,JPR,昨日,9月24日,发布的博文,全球附加板,AIB,显卡市场在2024年第2季度呈现出稳健的增长态势,报告详细解析了当前市场状况,并对未来趋势进行了预测,一、附加板显卡市场概述附加板,Add...。
电影视频 2024-09-25 14:25:10
石家庄酒店民宿隐藏摄像头事件,警方迅速行动,多名涉案人员被采取刑事和治安措施近日,一则关于博主在河北省石家庄市的一些酒店民宿内发现隐藏摄像头,并遭遇围堵的视频报道引起了广大网友的关注,此事不仅严重侵犯了公民的隐私权,也引发了公众对于公共场所安全的担忧,9月24日深夜,石家庄市公安局新华区公安分局迅速采取行动,发布了警情通报,详细披露了...。
电影视频 2024-09-25 12:58:43
超市店长辞职申请书尊敬的公司领导及各位同事,您们好!我要深深地感谢公司给予我工作和学习上的机会,以及各位领导和同事对我个人成长的无私帮助和关怀,在这里,我经历了许多挑战和机遇,也收获了许多宝贵的经验和知识,在此我要向你们表达我最真挚的谢意,随着我个人的发展和职业规划的需要,我决定在此提出辞职申请,我非常珍惜在公司的工作经历,但我也意识...。
电影视频 2024-09-24 10:10:27
美国针对中国智能汽车软硬件的潜在禁令,影响全球汽车产业链的举措环球时报报道,路透社最近援引两名知情人士的消息称,美国商务部预计将于本周一提议禁止美国道路上行驶的网联汽车和自动驾驶汽车使用中国的软件和硬件,这一行动被视为美国对中国汽车及软件和零部件的持续限制的重大升级,该禁令背后反映了美国对中国高科技领域的深度担忧和持续打压,这是美国在...。
电影视频 2024-09-23 10:31:53
公安机关查处一起编造传播资本市场虚假信息案件,维护金融秩序与信息传播秩序近日,一起涉及资本市场虚假信息的编造传播案件受到公安机关的严肃处理,随着互联网的深入发展,网络谣言的传播日益猖獗,尤其是在资本市场领域,一些虚假信息对市场造成了严重影响,这起案件的查处,彰显了公安机关维护金融秩序和信息传播秩序的决心,事件回顾近期,部分网民在网络平...。
电影视频 2024-09-21 20:48:21
十一小长假即将来临,许多家庭已经迫不及待想要出门旅行,然而带孩子的旅行往往让许多家长望而却步,近日,一款名为哈秀X1的遛娃行李箱横空出世,成为家长们的新宠,它不仅可以轻松解决带娃旅行的种种难题,更能让旅行变得更加轻松愉悦,哈秀X1遛娃行李箱是一款集行李箱和遛娃车于一身的出游神器,轻轻一拉,行李箱秒变遛娃车,六轮万向能推能拉,推起来丝滑...。
电影视频 2024-09-21 07:10:11
科技昨夜今晨播报日期,2024年9月20日星期五各位科技爱好者们,大家好,今天给大家带来一系列最新的科技资讯,一、三只羊全面复播,评论区限制评论权限调整近期,包括三只羊网络在内的多个公司在经历了一场风波后,于近日全面复播,据悉,这次复播发生在美诚月饼风波之后,引起了广泛关注,同时,有报道称三只羊网络直播间设置了仅粉丝可以评论的限制,截...。
电影视频 2024-09-20 11:07:04
三星与初创公司MojoMobility专利纠纷再升级,三星败诉并需支付巨额赔偿IT之家报道,北京时间9月18日消息,三星电子与加利福尼亚初创公司MojoMobility之间的专利纷争再次引发全球关注,这一次,判决结果指向了三星败诉,其被判侵犯了MojoMobility在无线充电技术方面的五项专利,此案历经数次交锋,于当地时间9月13日...。
电影视频 2024-09-18 21:46:50
B站发布2023年一季度财报,业务表现稳健,商业化步伐加速北京时间6月1日,哔哩哔哩,NASDAQ,BILI,HKEX,9626,简称B站,发布了截至2023年3月31日的未经审计财务报告,报告显示,公司第一季度总营收达50.7亿元人民币,同比增长0.3%,呈现出稳健的业务表现,随着公司在多个领域的持续优化和商业化步伐的加速,B站的亏...。
电影视频 2024-09-18 19:51:37