ARC Is a Vision Problem!
Jacob Andreas, Kaiming He一看这个作者就是不简单。这是一篇arc的刷分工作,有点类似于之前的hierarchical network。arc这个benchmark之前一般是选择题,让模型看到两个x->y的映射,去猜规则然后预测下一组输入的输出是什么。比如规则就比如下面图里面的俄罗斯方块下落。作者发现,arc的输入非常规律,所以其实可以变成一个图片生成任务,直接把每个块变成一个vit patch,然后不再用选择题,而是用next patch生成的方式,可以做到60分。
关键是作者给训练集的400题,每个题合成了1000个新的输入-输出对🤔所以有点从泛化性测试集变成train-based setting了
