连接不同语言模型和生成视觉模型进行文本到图像生成,LaVi-Bridge官网入口网址
大规模自回归图像模型预训练,AIM官网入口网址
先进的视觉基础模型,支持多种视觉和视觉-语言任务。Florence-2-base官网入口网址
基于llama3 8B的SOTA视觉模型,llama3v官网入口网址
先进的视觉基础模型,支持多种视觉和视觉-语言任务,Florence-2-large官网入口网址
基于InternViT-6B-448px-V1-5的增强版视觉模型
总奖金超 233 万!
报名即将截止