先进的视觉基础模型,支持多种视觉和视觉-语言任务,Florence-2-base-ft官网入口网址
大规模图像描述数据集,提供超过16M的合成图像描述。PixelProse官网入口网址
通过强化学习微调大型视觉-语言模型作为决策代理
PaliGemma 2是一个强大的视觉-语言模型,支持多种视觉语言任务。
PaliGemma 2是一款强大的视觉-语言模型,支持多种语言的图像和文本处理任务。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适