香港中文大学和清华大学共1篇
视频推理R1时刻,7B模型反超GPT-4o!港中文清华推出首个Video-R1-创奇社

视频推理R1时刻,7B模型反超GPT-4o!港中文清华推出首个Video-R1

港中文和清华团队推出Video-R1模型,首次将强化学习的R1范式应用于视频推理领域。通过升级的T-GRPO算法和混合图像视频数据集,Video-R1在视频空间推理测试中超越了GPT-4o,并且全部代码和数据集...
新智元的头像-创奇社新智元2天前
010