0%

2025-09-12-insights

发表于 2025-09-16 更新于 2025-09-22 分类于 Arxiv-Insights 阅读次数： Valine：
本文字数： 281 阅读时长 ≈ 1 分钟

FLUX-Reason-6M & PRISM-Bench: A Million-Scale Text-to-Image Reasoning Dataset and Comprehensive Benchmark

大手笔，作者用了15000 a100 day，蒸馏了6M条flux的数据，然后开源了

开源了，就是源神

SimpleVLA-RL: Scaling VLA Training via Reinforcement Learning

一篇vla rl的工作，作者直接用rl来优化vla。话说传统robotic领域似乎大家都在做rl了，但是vla领域好像确实一直没有人把rl跑work，为什么呢？