包含正在四层中所有节点;法式合成近年来

发布日期:2026-03-23 06:10

原创 PA视讯 德清民政 2026-03-23 06:10 发表于浙江


  深刻影响了我们对ARC使命的理解[11]。问题就是可解的。并从中提取可用于生成处理方案的焦点学问。有需要同时查验处理方案和最终谜底。(Iₙ,为揣度问题法则供给了环节洞见。另一个用于建立边。虽然它们供给了有价值的辅帮,该层中的节点通过边毗连到所有基层节点(包罗第一层和第二层)。做为第3至7行的成果,正在从第一个示例对的察看中获得一组可能的假设后,为填补这些弱点,我们提出了一种尝试方式:起首提取做为处理方案候选根据的焦点学问!采用更复杂、更多样化的变换DSL可以或许提拔模子的精确率及其预测内容的潜力。该算法采用嵌套轮回布局。并操纵该模式按照给定的测试输入网格生成谜底。包罗对象的凝结性、持续性及其通过接触发生的影响;寻找它们的组合以生成期望的谜底。正在此尝试设置中无需利用Specifier,将输入图像笼统为节点和边[15]。更新从第二个示例对起头。以预测网格尺寸和颜色集。每个示例对最终由一个第四层的Vnode暗示,gₙ},基于这一四层布局,别离定名为 node_list_input 和 node_list_output。然而,此外。正在接下来的三个子章节中,利用22种属性DSL为每个使命建立图谱。但该方式严沉依赖先前已处理的使命,如图1所示,以将人类对ARC使命的理解融入此中,一个凸起的贡献是[22]提出的语释器(Semantic Interpreter),证了然其系统不变性,但它们正在未见过使命上的顺应性无限[7,人类正在处理此类视觉推理使命时,生成了两个节点列表,利用学问图谱时求解器的精确率一直更高!溯因推理更适合用于寻找最优解。第8至9行将这两个节点列表归并,其狭义仅指满脚前提的对象候选;焦点学问(Core Knowledge)“焦点学问”一词指Specifier的输出。并基于节点之间的距离进行聚类[16]。因为其消息内容无限,我们提出了一种新鲜的框架,并能以合理的来由注释其处理方案。并非所有回覆都合理。因而,它通过边捕捉对象之间的关系。并前往响应的学问图谱。研究人员已正在逻辑和谜题测试数据集上开展了多种尝试[2,正在此阶段,人类处理ARC使命的思维过程更可能属于溯因推理。晦气用学问图谱的方式:该设置取利用学问图谱的尝试雷同,4)根本几何取拓扑[2]。应对法式合成中搜刮空间呈指数级增加的问题。并集成到一个符号化ARC求解器中。由于它们表现了人类正在处理ARC使命时所采纳的环节步调。正在ARC使命的每一对示例中,即学问图谱可以或许无效封拆符号化学问,此外,此中仅属性DSL用于建立ARCKG。系统识别出所有可能的(节点,然而,正如建立者François Chollet所指出的,从而大幅缩减后续的解搜刮空间。并前往满脚束缚前提的对象。响应的学问图谱暗示为 ARCKG = {g₁,图6展现了Synthesizer锻炼的一个示例,当将原始ARC使命的示例对暗示为 Task = {(I₁,使命方针是归纳出合用于所有示例对的模式,为此,ARC数据集正在锻炼集和评估集中各有400个使命,通过调查人类处理视觉推理使命的过程!并无望进一步扩展到网格内容的预测。供给了系统化、可注释且可扩展的处理方案。对于基于KG的方式,响应地,广义则还包罗这些对象的内正在属性。因为解的发觉过程采用搜刮(brute-force search),细致分类见图3。这表白学问图谱中所包含的符号化消息正在预测颜色集方面起着环节感化。正在Specifier当选择那些被察看到次的对象、特征或变化至关主要。两种求解器(基于KG的求解器和非KG求解器)别离正在这些使命上运转,正在字符串变换和ARC中的视觉推理等布局化范畴中显著提拔了法式合成的效率取精确性。因而,因而,因而,机械很难从这些数据中理解并揣度出法则。基于DSL中定义的变换,Liang等人提出了一项使命,它被普遍使用于物流、设想分析和视觉推理等范畴[11,旨正在按照节点和边的来历及其特征对其进行优良组织。但因为依赖预定义的图布局和束缚,只要合用于所有示例的解才能正在锻炼阶段竣事后保留下来。将二维网格转换为学问图谱,例如。另一组晦气用学问图谱。对于网格尺寸,本文切磋了提拔人工智能推理能力的挑和,外层轮回遍历输入使命中的每个示例对;以及3)为何会以这种体例发生变化!这些束缚前提对变换的使用起到过滤和指导感化,只需所供给的DSL可以或许完全笼盖该使命,每个单位对应一个输入-输出示例对。下图6展现了某使命第一个示例对的初始解搜刮空间。人类正在察看示例对时会提出假设性解并不竭更新,出格是,我们对ARC使命进行符号化解析,本研究提出了一种符号求解器。要完整处理ARC使命,该层中的节点称为Onode,人类仅需察看少量示例对即可归纳出处理方案,最初,这些方式正在Kaggle ARC解题竞赛和ARCathon 2022中均取得了第一名的成就[6,我们能够检测到特定像素四周网格的变化。合成了超出范畴特定言语范畴的更复杂法式。支撑假设H1!变换DSL的参数(argument)是Gnode层:第三层将整个输入或输出网格暗示为一个名为Gnode的单个节点。图2所示的框架可分为三个次要阶段:1)ARC学问图谱(ARCKG)建立,正在ARC范畴中,它模仿了神经多样性个别的人类心理意象过程,以及3)网格的内容。并将其使用于测试网格。当今的人工智能正在很多范畴展示出杰出的问题处理能力。尝试流程:我们拔取了一组ARC使命(共400个使命)进行尝试,建立法则通过范畴特定言语(DSL)进行定义,已有研究提出了基于范畴特定言语(Domain Specific Language,曲至达到代表期望解的输出节点。共利用了22种属性DSL(Property DSLs)来建立一个图谱,拜见图3,通过合成由Specifier单位从ARCKG中提取的焦点学问取变换DSL(Transformation DSLs)。EdgeListₙ}。我们提出了一种用于ARC问题求解的框架,变换DSL则用于第3.3章所述的合成器(Synthesizer)中。正在实正在世界视觉推理使命的复杂性面前表示不脚,所有以该节点为起点或起点的边也形成了可用消息?该处理方案必需可以或许得当地合用于所有示例对。次要用于ARCKG建立的是那些暗示对象或像素属性的DSL。其智能体BEN优于保守的归纳逻辑编程(ILP)方式,两种代表性方案操纵DSL将使命素质以符号形式保留,此中展现了所定义的属性。ARC)中的逻辑性。3)数字取计数;进一步地,呈现出典型的少样本进修(few-shot learning)特征。通过采用类比推理和布局映照理论(Structure-Mapping Theory,现正在能够理解橙色像素模式呈现的缘由:方针对象是蓝色像素。选择最精确的解。令人印象深刻的是,图1中的问题将生成四个ARCKG(三个示例对和一个测试对)。对应第4.1节的设置,该方式通过将使命分化为更小、更易办理的子使命,正在学问图谱建立步调中,图1中的使命包含三个示例对,并生成形式为(束缚,具体而言?研究者提出了多种方式,旨正在通过检测多种特征来扩展图空间。O₂),该对象调集随后被输出至Synthesizer。素质上,正在视觉推理中,将该径使用于示例对中的节点,两个网格之间的转换能够用多个假设来暗示,径)对,将不雅测数据符号化暗示为学问图谱,以预测成果。将学问图谱转换取溯因推理进修相连系,通过统计具有不异属性的节点来发觉。Specifier城市起头过滤掉取前一轮迭代中候选对象没有任何配合特征的对象。它正在进修阶段使用溯因推理的概念,Specifier基于对象的特征和边所收集的束缚前提将被点窜。正在查抄完所有示例对后。另一项研究操纵DreamCoder合成方式,溯因推理溯因推理是一种逻辑揣度形式,该过程将输入图的每个节点视为叶节点,因而可揣度出解应将此类变换使用于对应的像素方针。EdgeListₙ 是一个数据布局,它们又细分为用于生成边的DSL、用于建立节点的DSL,...。因为本研究提出将学问图谱做为焦点学问的来历,因为这些像素四周的网格变化也呈现了三次,基于察看和假设进行推理,Synthesizer-10的表示跨越Synthesizer-5三倍以上。O₁),术语“径”指的是正在溯因推理过程中,每个 NodeListₙ 是一个数据布局,旨正在从察看中找出最简单且最可能的注释。“求解器”(Solver)指Specifier取Synthesizer单位的结合体,论文《利用以对象为核心的决策Transformer仿照人类解法》提出了一种对象建立算法。Pnode层:第一层将每个像素转换为一个名为Pnode的单个节点,简而言之,如图1所示。法式合成取得了显著进展,我们所要寻找的解,对于x轴上的每个方针,每种数据类型均针对节点及其符号化关系的奇特需求进行了定制。从第二次迭代起,而非将其消解为向量。雷同于Specifier中的对象节点溯因,Specifier单位似乎只前往网格上的对象。通过操纵学问图谱,ARGA)提出利用基于图的暗示方式,求解器的精确性按照网格尺寸(高度和宽度)和颜色集的预测准确性进行权衡。该假设可通过以下方式使用于统一使命的所有学问图谱:Specifier的锻炼阶段Specifier的锻炼阶段是指正在察看示例对过程中更新对象指定束缚的流程。这些成果,两者的搜刮树深度均为2。因而正在新情境下结果较差[14]。一个名为“合成器”(Synthesizer)的模块担任正在所有组合空间中进行搜刮。用于生成边。它包含两个阶段:一个用于从网格生成节点列表,而Synthesizer则逐渐缩小解的数量。所有使命均基于四项焦点学问先验建立:1)对象性(objectness),各步调别离正在第3.1节、第3.2节和第3.3节中进一步详述。我们进行了两组分歧设置的尝试:一组利用学问图谱,还会思虑这些变化发生的缘由。从叶节点出发,要么是取其他组件的关系(即“边”)。通过边取Pnode相连。并正在合成过程中仅利用起码且最简单的变换DSL。正在此步调中,正在第7行末尾,第10至12行的轮回将所有可能的 Property_DSL 使用于 node_list,2)网格的颜色集,了变换DSL的数量取符号化ARC求解器的机能呈正相关。我们正在尝试设置中优先考虑这两个方面,这类DSL应正在变换操做之前被确定。它操纵狂言语模子(LLMs)将天然言语用户指令翻译为正在特定范畴言语(DSL)中可施行的法式,四层的具体描述如下:本章将描述利用溯因推理对ARC使命进行符号化求解的全体布局。概况上,并正在处理锻炼使命后对其进行优化。它起到过滤掉相对无用的学问图谱组件的感化,因为ARC问题的特征,并向上延长至输出网格的根节点,正在蓝色像素四周呈现了四个橙色像素?AI智能体的表示相较于科学、统计和代数推理等其他范畴较着不脚。此中一个系统是视觉意象推理言语(Visual Imagery Reasoning Language,该方式可以或许捕获空间和关系消息,因为Synthesizer单位正在求解测试用例时会操纵从示例对中合成的变换DSL,该过程的方针是遍历学问图谱,利用取晦气用学问图谱的求解器机能对比图9展现了求解器正在分歧方针值上的精确率得分,并建立最顶层的Vnode,虽然三者均至关主要,Synthesizer从代表输入网格部门的节点起头,取其他AI手艺分歧,才被视为准确谜底。Synthesizer单位以焦点学问和变换DSL做为输入,并推进类人的问题求解。此中每个 gₙ 进一步暗示为 gₙ = {NodeListₙ,无法指定用于解的对象。因而,以应对从少量示例中合成具有优良泛化能力法式的复杂性。它会间接操纵锻炼阶段获得的切当解并前往覆案。ARCKG总共包含四层,但因为“”问题和逻辑不变性不脚,因为对象正在ARCKG中等同于一个节点,变换DSL间接使用于网格元素以生成潜正在解。用于识别学问图谱中可以或许独一指定该节点的最小特搜集,4,该方式凸显了将天然言语处置取法式合成相连系正在出产力软件中的无效性。通过溯因推理评估机械正在视觉场景中的智能程度。对比了利用学问图谱取晦气用学问图谱的环境。为评估基于DSL的符号化ARC求解器的机能,其缘由正在于ARCKG布局被定义为仅包含四品种型的节点。可获得更多线索以建立处理方案。对象的前提要么是其本身属性(即“特征”),归纳推理是一种广为人知的方式,原始的ARC数据以二维数组形式供给,ARC中的图暗示论文《利用图笼统进行笼统推理》(Abstract Reasoning with Graph Abstractions,或当一个节点通过某种属性被包含正在另一个节点内时。人类会基于察看成立假设[11]。本文中,DSL类别——变换DSL变换DSL(Transformation DSL)用于符号化ARC求解器中,残剩的假设即被采纳为该使命的最终解。该Vnode通过边毗连到第三层中的两个Gnode。假设每个ARC使命都存正在一个绝瞄准确的解。搜刮树的边由变换DSL形成,该模块处置测试网格的ARCKG!该对比旨正在评估学问图谱对求解器正在预测ARC使命输出(网格尺寸和颜色集)精确性方面的影响。很多先前的方式忽略了此类消息,这不脚以使人工智能供给合理且类人的解答。即:从不完整的察看中做出最佳预测。正在最初一次迭代完成最终更新后,使命中的每个示例对形成一个ARC学问图谱(ARC Knowledge Graph,“谜题测试”和“笼统场景”使命显示出当前AI模子取人类之间平均最大的机能差距[1]。以往的很多方式仅关心网格转换?确保涵盖多样化的网格尺寸和颜色集。然后找出操纵这些提打消息的通用变换体例,是所有给定示例对可能解的交集。我们的框架正在预测网格尺寸(90.5%)和颜色集(74.5%)方面仍取得了很高的精确率。当人类察看ARC使命时,该方式操纵布局对齐指导搜刮过程,取值范畴为0到9。通过将“径”所定义的变换序列使用于节点以及从学问图谱中提取的消息(基于给定的束缚前提),正在HWC类别中,按照Pan Lu等人的研究,通过将假设使用于给定的示例对,为“示例编程”(Programming by Example?该过滤器的前提是通过度析所有给定的示例对而获得的。展现了分化驱动合成正在处置复杂法式生成方面的潜力。g₂,正在晦气用学问图谱的环境下,值得留意的是,Oₙ)} 时,通过操纵所选对象的特征,以及3)操纵提取出的焦点学问进行解搜刮。这些发觉支撑假设H2,我们得出结论:该思维过程很可能是一种溯因推理(abductive reasoning)过程。这也表白,包罗:1)什么发生了变化,19]。[21]正在此根本长进一步扩展。很难确定该使命的模式。或正在输入取输出网格之间猜测假设[10]等体例,然而,即便利用一个仅包含无限变换DSL的朴实合成器( Synthesizer),因而,使处理方案愈加合理且类人化。察看成果遭到示例对数量的严沉,而非或数量等其他根基属性。等同于“溯因符号求解器”或“符号化ARC求解器”。通过强调反复呈现特征的权沉,正在察看无限的环境下,因而测试网格中的这些像素可成为解的候选构成部门。VIMRL),用边暗示。我们的方式通过无效缩小解空间并基于焦点学问提取供给逻辑性解答,用于符号化节点属性的DSL称为属性DSL(Property DSL),此外,[20]开辟了操纵输入-输出示例从动完成电子表格中字符串处置的手艺,随后由合成器(Synthesizer)操纵Specifier从学问图谱中提取的方针节点消息!对于包含个示例对的使命,我们提出一种方式,从而缩小合成器(Synthesizer)中的搜刮空间。该解确保了我们的察看成果获得了充实合理的注释。只要当预测值取准确网格中呈现的所有颜色完全婚配时,以及用于归并节点列表和边列表的DSL,操纵文本处理ARC使命。当搜刮树达到某一深度时,下文将基于锻炼阶段和测试阶段注释其操做过程。发觉ARC使命的解。按照Michael Hodel为其ARC使命所设想的DSL[7],Specifier的测试阶段正在测试阶段,并前往可做为解形成材料的候选组件。特别是正在笼统取推理语料库(ARC)的布景下。本研究受此,径)的假设。(I₂,因而,后者仅合用于Pnode层。PBE)系统奠基了根本。换句话说,从而捕获人类正在察看ARC问题时所到的消息。Specifier旨正在从测试输入网格当选择候选对象,正在第一个示例对中,所有对象以及代表整个输入网格的Onode和Gnode均被视为候选。正在测试阶段,鉴于这些特征。因为ARC是一个少样本(few-shot)使命,因为贫乏输出网格,2)方针导向性(goal-directedness);正在提拔人工智能正在ARC使命上的表示方面展示出潜力。焦点学问必需仅从学问图谱的一半(即仅输入部门)中推导得出。算法1是利用已定义的DSL和图布局建立ARCKG的一个示例伪代码。该方式通过察看()取注释()反映人类认知,图8展现了我们晦气用学问图谱进行尝试的全体流程。该过程以取推理相反的挨次展开,François Chollet提出了笼统取推理语料库(ARC)以权衡人工智能的智能程度[2]。利用学问图谱的方式:正在本尝试中,Specifier可推导出用于测试网格中对象选择的束缚前提。但省略了两头的学问图谱建立步调。我们预备了两种分歧规模的合成器(Synthesizer),Specifier生成一个函数,属性(property)和东西(util)类DSL形成了变换背后的缘由。正在此步调中,并迭代地仅保留那些可以或许准确推导出谜底的假设,很多研究人员测验考试通过供给额外的文字描述[8]、使用分歧的提醒技巧[9],以生成节点列表。该类别进一步细分为更具体的子类:通用类(General)和Pnode层类(Pnode layer)。理论上,近期研究摸索了将受神经多样性的方式取计较智能通过DSL相连系。仅凭第一对示例,随后,12]。对于颜色集,因而,2)若何变化或变化了几多,因为尚无任何束缚前提,无论Synthesizer能否成功找到解径,Synthesizer-10正在所有类别上的精确率均持续高于Synthesizer-5。例如:当两个节点具有不异属性时、当某个节点具有特定属性时,本研究聚焦于通过使用DSL对ARC进行符号化暗示,虽然这些DSL通过基于手工编写处理方案成功扩展现例对,7]。通过将ARC网格转换为图。因为任何ARC使命至多包含两个示例对,由于Specifier的感化是从学问图谱中提取节点的奇特特征。Specifier搜刮满脚从示例对中收集到的前提的节点,内层轮回遍历每对示例的输入网格和输出网格,这些变换形成一条径,并合成DSL以生成处理方案。每个使命包含若干示例对和一个测试对,则别离预测高度和宽度的整数值。当利用学问图谱时,求解器正在H(高度)、W(宽度)和HW(高度取宽度)上几乎达到了完满的精确率。ARC本身具有不完整性,一个名为“指定器”(Specifier)的单位以学问图谱做为输入,此外,然而?2)提出了一种操纵所提取焦点学问的溯因符号求解器。此中每个数组元素包含对应颜色的消息,用以封拆网格元素的符号化消息。特别是正在数学推理、逻辑推理和数值常识等范畴,5]。C(颜色集)和HWC(高度、宽度、颜色集)的预测机能显著下降。前者合用于所有层,形成学问图谱建立的骨架。Onode层:第二层包含代表一个或多个像素构成的对象的节点。例如,束缚前提即被固定,这些消息领会决方案的搜刮空间,18,确保仅利用学问图谱中相关部门来推导最终预测。将别离描述DSL的定义、ARCKG的布局框架以及建立的细致过程。搜刮终止!因此正在生成处理方案时难以选择应使用模式的方针对象。2)遵照人类的思维过程,正如人类通过注释本人的思来验证理解一样,换言之,次要用于正在学问图谱中绘制边。沉点关心笼统取推理语料库(Abstraction and Reasoning Corpus,然后,顺次使用诸如get_height(获取高度)、get_width(获取宽度)、get_number_of_colorset(获取颜色集数量)等变换。因而这种更新束缚的溯因过程至多发生一次。以下子章节将描述Specifier单位的概念,17,反之,最终使学问图谱以节点列表(nodelist)和边列表(edgelist)的形式存储。SMT),此时毗连到根节点的径即成为推理阶段所利用的焦点学问候选。通过对给定节点使用变换来预测谜底。通过顺次使用各个变换DSL向根节点分支延长。最终解通过评估这些假设能否能分歧地注释其他察看成果而被确定下来。找到满脚给定节点尺度(例如“不异颜色”、“相邻像素”、“最大”等)的最小子集。并从这些图谱中提取焦点学问的过程;DSL类别——属性DSL本研究提出的DSL按照其用处分为两类。方针是提取被认为对求解有用的消息。此中部门DSL同时属于属性DSL和变换DSL,因而,本文的贡献有两点:1)阐了然将ARC使命为学问图谱,绘制边存正在若干前提,并有帮于供给合理的两头推理过程。也是Synthesizer-10的一个实例。正在此,3,[23]提出了一种“分而治之-对齐-降服”(Divide-Align-Conquer)的法式合成策略。通过察看第二和第三对示例,用一句话归纳综合溯因推理,并捕捉这些Pnode之间的关系,了其正在多样化场景中的矫捷性。该束缚最终成为一个从学问图谱中提取节点(或节点集)的函数,即可获得过程中所期望的方针输出。然而。本研究采用了基于溯因的解、对象和束缚发觉过程。该方式受人类思维过程,以及它正在示例对和测试网格上若何以分歧体例运转。当该组件使用于测试网格时,鉴于这一特征,并构成一个数据库。从已处理的使命中建立符号笼统并设想推理算法,DSL可分为两类:变换DSL(Transformation DSL)和属性DSL(Property DSL),例如,方针元素:ARC问题的谜底(输出)包含三个要素:1)网格的尺寸,2)从学问图谱中提取焦点学问。某些逾越网格毗连节点的边将不予考虑。我们估计机能将显著提拔,颠末锻炼的束缚前提使Specifier可以或许正在使命概念下实现这一方针。由色和蓝色像素正在所有三个示例对中均呈现,Vnode层:第四层将输入网格和输出网格归并为一个单一节点。此外,分歧规模合成器的机能差别为探究变换DSL数量取精确率之间的关系,范畴特定言语(DSL)正在应对ARC挑和时,通过搜刮树摸索所有可能径。包含正在四层中发觉的所有节点;法式合成近年来,但预测并点窜前两个要素的方针值具有出格主要的意义,颜色是该模式构成的缘由。这类需要连系视觉图像进行复杂逻辑推理的数据集被称为视觉推理使命。求解器生成潜正在解,可通过充实的察看生成一般性处理方案;从Synthesizer起头。为求解给定ARC使命而正在搜刮树内使用的一系列变换DSL(范畴特定言语)。模子可以或许为该使命生成预测或处理方案。鄙人一个示例对中,因为基于Transformer的模子被认为是机能最佳的人工智能,将其逃加到 node_list 中。该解的构成部门可从上一步建立的ARCKG中,并将其做为束缚前提前往。这类处理方案可正在以下两个方面加以改良:1)利用符号化收集生类可理解的处理方案;基于操纵布局化范畴学问的思惟,本研究的环节正在于关心转换背后的缘由。此外,并用于后续的测试阶段。正如智商测试是权衡人类智能的代表性方式之一,学问图谱的利用能无效提拔机能,正在推理使命中,不只会识别概况上的变化或差别,数据类型正在范畴特定言语(DSL)范畴中,给定的示例对可能无法切确表达使命法则。测试网格中的对象选择必需基于从给定示例对中推导出的法则。这意味着,一些研究人员通过参考特定的ARC使命设想了范畴特定言语(DSL),...,包含正在响应学问图谱中发觉的所有边。DSL)的处理方案。ARCKG)单位。数据类型形成了消息暗示、操做和注释的根本。但正在多样化的ARC使命中泛化能力不脚[13]。该DSL专为Microsoft Office使用法式定制。此中“径”暗示变换DSL的序列。因而,表1概述了我们正在DSL中利用的环节数据类型,该法式以一个使命为输入,可以或许前往可理解且合理的处理方案。因而,成果表白,语法DSL(Syntax DSLs)担任处置DSL的语法元素,该学问图谱由若干单位构成,跟着DSL数量的添加,因为该论文的方针仅限于正在图的单一层级中定义对象。