WorldModelBench 是一个多学科、多领域的视频生成模型基准平台,涵盖 7 大领域(如机器人、驾驶、动画等)56 个子领域,包含 350 个场景化提示。其核心功能是通过指令遵循、常识一致性和物理规则遵守三大维度评估模型的世界建模能力,采用 67K 人类标注数据训练 2B 多模态裁判模型实现自动化评估,并提供实时排行榜对比模型性能。
具体的网页地址:https://worldmodelbench-team.github.io/

具体的网页地址:https://worldmodelbench-team.github.io/
