高性能语言模型基准测试数据集,DCLM-baseline官网入口网址
提供机器学习领域的标准数据...,UCI Machine Learning Repository官网入口网址
将Common Crawl转化为精细的长期预训练数据集
大规模多模态医学数据集,MedTrinity-25M官网入口网址
内容风格合成在文本到图像生成中的应用,CSGO官网入口网址
由中国科学院软件研究所提供...,中国科学院软件研究所机器学习数据集官网入口网址
生成任何3D和4D场景的先进框架
大规模多模态推理与指令调优平台
一个利用人工智能帮助学习和贡献美国手语(ASL)的平台。
地球科学的开源大预言模型,首先在收集和清理过的地球科学文献(包括地球科学开放存取论文和维基百科页面)上对 LLaMA 进行进一步预训练,然后使用知识密集型指令调整数据(GeoSignal)进行微调,K2-上海交通大学官网入口网址
斯坦福大学提供的大型网络和...,Stanford Large Network Dataset Collection官网入口网址
美国政府的公开数据集门户网站,Data.gov官网入口网址
用于研究无约束人脸识别的数...,Labeled Faces in the Wild (LFW)官网入口网址
Google研究提供的数据集列表,Google Research Datasets官网入口网址
高质量的数据集、工具和概念,用于大型语言模型的微调。
用于训练通用目标分割模型的视频数据集,SA-V Dataset官网入口网址
Level-Navi Agent是一个无需训练即可使用的框架,利用大语言模型进行深度查询理解和精准搜索。
百度旗下AI算力、学习和实训平台,飞桨AI Studio星河社区官网入口网址
提供机器学习算法和数据集的...,OpenML官网入口网址
Google提供的数据集搜索工具,Google Dataset Search官网入口网址
提供大量数据集,用于数据科...,Kaggle Datasets官网入口网址
亚马逊Web服务提供的公开数据...,Registry of Open Data on AWS官网入口网址
生成开放世界视频游戏的扩散变换模型
数据驱动的框架,增强大型语言模型的工作流编排能力
开源的先进语言模型后训练框架
用于对象检测、分割和字幕的...,COCO (Common Objects in Context)官网入口网址
提供开发和比较强化学习算法...,OpenAI Gym官网入口网址
提供社会科学研究的数据集,ICPSR (Inter-university Consortium for Political and Social Research)官网入口网址
Dolphin R1是一个用于训练推理模型的数据集,包含80万条样本。
自监督触觉表示,用于基于视觉的触觉传感。
多语言预训练数据集
高质量数据集,用于OLMo2训练的第二阶段。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适