应用介绍
如图1所示,研究者证明了对一个7B参数的多模态模型Qwen2.5-VL-7B进行后训练,让它玩类似「贪吃蛇」这样的简单街机游戏,不仅能泛化到其他游戏,还在多模态数学基准(如MathVista)和多学科问答(如MMMU)上获得了显著的跨领域能力提升。
如图1所示,研究者证明了对一个7B参数的多模态模型Qwen2.5-VL-7B进行后训练,让它玩类似「贪吃蛇」这样的简单街机游戏,不仅能泛化到其他游戏,还在多模态数学基准(如MathVista)和多学科问答(如MMMU)上获得了显著的跨领域能力提升。