只需一步,快速开始
短信验证,便捷登录
军衔等级:
少尉
多模态大模型在听觉上,居然也出现了「9.11>9.8」的现象,音量大小这种简单问题都识别不了!港中文、斯坦福等大学联合发布的AV-Odyssey基准测试,包含26个视听任务,覆盖了7种声音属性,跨越了10个不同领域,确保测试的深度和广度。
论文链接:https://arxiv.org/pdf/2412.02611 项目地址:https://av-odyssey.github.io/ 代码地址:https://github.com/AV-Odyssey/AV-Odyssey
0 举报本楼
发表回复 回帖后跳转到最后一页
手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图
GMT+8, 2024-12-22 22:27 , Processed in 0.172392 second(s), 16 queries , Gzip On.
Copyright © 1999-2023 C114 All Rights Reserved
Discuz Licensed