MMStar官网
一个用于评估大型视觉语言模型的精英基准测试集
MMStar简介
需求人群:
"MMStar主要用于评估和分析大型视觉语言模型在多模态任务上的能力表现,有助于发现模型潜在的问题并指导未来的模型改进。"
使用场景示例:
研究人员可以使用MMStar评估自己训练的视觉语言模型在不同视觉语言任务上的表现。
模型开发者可以通过MMStar发现自己模型存在的数据泄露问题,并采取相应措施。
基准测试的结果可以为进一步改进现有视觉语言模型提供指导和启发。
产品特色:
包含1500个高质量视觉语言样本
覆盖6个核心能力和18个细分维度
人工审查确保视觉依赖性和最小化数据泄露
提出多模态增益和数据泄露两个新指标
基准测试16种顶尖视觉语言模型
MMStar官网入口网址
https://mmstar-benchmark.github.io/
小编发现MMStar网站非常受用户欢迎,请访问MMStar网址入口试用。
数据统计
数据评估
关于MMStar特别声明
本站Home提供的MMStar都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由Home实际控制,在2024年 4月 17日 下午9:44收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,Home不承担任何责任。
相关导航
暂无评论...