高性能语言模型基准测试数据集,DCLM-baseline官网入口网址
大规模多模态医学数据集,MedTrinity-25M官网入口网址
内容风格合成在文本到图像生成中的应用,CSGO官网入口网址
用于训练通用目标分割模型的视频数据集,SA-V Dataset官网入口网址
将Common Crawl转化为精细的长期预训练数据集
生成开放世界视频游戏的扩散变换模型
自监督触觉表示,用于基于视觉的触觉传感。
生成任何3D和4D场景的先进框架
数据驱动的框架,增强大型语言模型的工作流编排能力
开源的先进语言模型后训练框架
大规模多语言偏好混合数据集
多语言预训练数据集
大规模多模态推理与指令调优平台
高质量的数据集、工具和概念,用于大型语言模型的微调。
高质量数据集,用于OLMo2训练的第二阶段。
总奖金超 233 万!
报名即将截止