WIT(基于维基百科的图像文本)数据集是一个大型的多模态多语言数据集,包含超过3700万个图像文本集合,支持100多种语言,为多模态机器学习模型的训练和评估提供丰富的数据,WIT by Google AI官网入口网址
大规模多模态预训练数据集
总奖金超 233 万!
报名即将截止