高性能语言模型基准测试数据集,DCLM-baseline官网入口网址
提供机器学习领域的标准数据...,UCI Machine Learning Repository官网入口网址
美国政府的公开数据集门户网站,Data.gov官网入口网址
大规模多模态医学数据集,MedTrinity-25M官网入口网址
内容风格合成在文本到图像生成中的应用,CSGO官网入口网址
地球科学的开源大预言模型,首先在收集和清理过的地球科学文献(包括地球科学开放存取论文和维基百科页面)上对 LLaMA 进行进一步预训练,然后使用知识密集型指令调整数据(GeoSignal)进行微调,K2-上海交通大学官网入口网址
由中国科学院软件研究所提供...,中国科学院软件研究所机器学习数据集官网入口网址
提供开发和比较强化学习算法...,OpenAI Gym官网入口网址
Google研究提供的数据集列表,Google Research Datasets官网入口网址
生成任何3D和4D场景的先进框架
用于训练通用目标分割模型的视频数据集,SA-V Dataset官网入口网址
百度旗下AI算力、学习和实训平台,飞桨AI Studio星河社区官网入口网址
斯坦福大学提供的大型网络和...,Stanford Large Network Dataset Collection官网入口网址
提供机器学习算法和数据集的...,OpenML官网入口网址
用于对象检测、分割和字幕的...,COCO (Common Objects in Context)官网入口网址
Google提供的数据集搜索工具,Google Dataset Search官网入口网址
提供大量数据集,用于数据科...,Kaggle Datasets官网入口网址
亚马逊Web服务提供的公开数据...,Registry of Open Data on AWS官网入口网址
用于研究无约束人脸识别的数...,Labeled Faces in the Wild (LFW)官网入口网址
Dolphin R1是一个用于训练推理模型的数据集,包含80万条样本。
将Common Crawl转化为精细的长期预训练数据集
生成开放世界视频游戏的扩散变换模型
自监督触觉表示,用于基于视觉的触觉传感。
数据驱动的框架,增强大型语言模型的工作流编排能力
开源的先进语言模型后训练框架
大规模多语言偏好混合数据集
多语言预训练数据集
大规模多模态推理与指令调优平台
高质量的数据集、工具和概念,用于大型语言模型的微调。
高质量数据集,用于OLMo2训练的第二阶段。
OpenAI提供的数据集资源列表,OpenAI Datasets官网入口网址
AI研究的数据集,由艾伦人工...,Allen Institute for AI Datasets官网入口网址
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适