2025-11-19-insights

发表于 2025-11-23 分类于 Arxiv-Insights 阅读次数： Valine：
本文字数： 332 阅读时长 ≈ 1 分钟

ARC Is a Vision Problem!

Jacob Andreas, Kaiming He一看这个作者就是不简单。这是一篇arc的刷分工作，有点类似于之前的hierarchical network。arc这个benchmark之前一般是选择题，让模型看到两个x->y的映射，去猜规则然后预测下一组输入的输出是什么。比如规则就比如下面图里面的俄罗斯方块下落。作者发现，arc的输入非常规律，所以其实可以变成一个图片生成任务，直接把每个块变成一个vit patch，然后不再用选择题，而是用next patch生成的方式，可以做到60分。

关键是作者给训练集的400题，每个题合成了1000个新的输入-输出对🤔所以有点从泛化性测试集变成train-based setting了