资讯
在讨论部分,研究人员指出,这些结果挑战了传统观点,表明棕熊雌性在配偶搜寻中可能发挥着比以往认为的更积极的作用。雌性棕熊在交配季节增加移动距离,可能是为了寻找高质量的配偶,同时也有助于避免杀婴行为。因为与多个雄性交配可以增加次年遇到幼崽可能父亲的概率,从而降低雄性杀婴的风险。这一行为与其他大型草食性动物雌性在繁殖季节增加活动的现象类似,如狍(Capreolus ...
来自 NUS 的团队提出了 Impossible Videos 概念,即那些违背物理、生命、地理或社会常识的视频,并构建了 IPV-BENCH,一个全新的基准,用于评测 AI 模型在 “反现实” 视频生成与理解方面的极限能力。
AI频频刷新基准测试纪录,却算不清「strawberry」里到底有几个字母r,在人类看来很简单的问题却频频出错。这种反差促使创意测评兴起,例如由一名高中生开发的MC-Bench,用Minecraft方块「竞技场」模式评价AI能力。这种新的测评范式,或 ...
这一多模态大模型(LMMs)评估基准,旨在全面评估AI在复杂城市场景下的表现,尤其是随着全球城市化进程的加速,对AI技术在城市规划和日常决策中的应用愈发显得重要。 UrBench的核心创新在于其设计的多视角评估机制。该基准涵盖14种城市任务,并通过相关 ...
人工智能在应对这些复杂挑战方面展现出巨大潜力。然而,目前大多数多模态大模型(LMMs)在城市场景的表现仍有待提升。近日,在协会促进人工智能(AAAI)2025会议上,研究者们提出了名为UrBench的全新基准,旨在系统评估LMMs在多视角城市场景中的能力。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果