0%

2025-09-12-insights

FLUX-Reason-6M & PRISM-Bench: A Million-Scale Text-to-Image Reasoning Dataset and Comprehensive Benchmark

大手笔,作者用了15000 a100 day,蒸馏了6M条flux的数据,然后开源了

开源了,就是源神

SimpleVLA-RL: Scaling VLA Training via Reinforcement Learning

一篇vla rl的工作,作者直接用rl来优化vla。话说传统robotic领域似乎大家都在做rl了,但是vla领域好像确实一直没有人把rl跑work,为什么呢?