Apollo是一个多语言医学领域的模型、数据集、基准和代码库,Apollo LLM官网入口网址
一个用于评估大型视觉语言模型的精英基准测试集,MMStar官网入口网址
用于评估文本到视觉生成的创新性指标和基准测试,VQAScore官网入口网址
医疗领域检索式问答基准测试,Benchmark Medical RAG官网入口网址
在线聊天机器人竞技场,比较不同语言模型的表现。LMSYS Chatbot Arena官网入口网址
综合表格数据学习工具箱和基准测试,LAMDA-TALENT官网入口网址
高性能语言模型基准测试数据集,DCLM-baseline官网入口网址
数据库查询的自然语言处理基准测试,TAG-Bench官网入口网址
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适