SigLIP2 是谷歌推出的一种多语言视觉语言编码器,用于零样本图像分类。
利用AI将内容组织成清晰分类
基于InternViT-300M-448px的增强版本,提升视觉特征提取能力。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适