视觉模型 - Home

视觉模型

LaVi-Bridge

连接不同语言模型和生成视觉模型进行文本到图像生成，LaVi-Bridge官网入口网址

大规模自回归图像模型预训练，AIM官网入口网址

Florence-2-base

先进的视觉基础模型，支持多种视觉和视觉-语言任务。Florence-2-base官网入口网址

基于llama3 8B的SOTA视觉模型，llama3v官网入口网址

Florence-2-large

先进的视觉基础模型，支持多种视觉和视觉-语言任务，Florence-2-large官网入口网址

InternViT-6B-448px-V2_5

基于InternViT-6B-448px-V1-5的增强版视觉模型

高效的视觉编码技术，提升视觉语言模型性能。