BAGEL是一款开源的统一多模态模型,您可以在任何地方进行微调、精简和部署。
Doubao-1.5-pro 是一个高性能的稀疏 MoE 大语言模型,专注于推理性能与模型能力的极致平衡。
国产化大模型,支持多模态,快速低成本智能化转型。
多模态大型语言模型,提升视觉与语言的交互能力。
先进多模态大型语言模型系列
革命性的AI图像编辑与生成技术,结合了文字指令和视觉语境,实现精准编辑和风格转移。
一个强大的工具,它通过引入图像提示来增强文本到图像扩散模型的能力。它的设计轻量且高效,易于部署和使用,同时支持广泛的应用场景,包括图像生成、转换和修复。通过解耦的交叉注意力机制,IP-Adapter能够更好地理解和利用图像信息,从而生成更准确、更丰富的图像内容,IP-Adapter官网入口网址
SmolVLM-500M 是一个轻量级多模态模型,能够处理图像和文本输入并生成文本输出。
124B参数的多模态大型语言模型
多模态大型语言模型,提升视觉和语言的综合理解能力
高性能多模态语言模型,适用于图像和视频理解。MiniCPM-V 2.6官网入口网址
CLaMP 3 是一个用于跨模态和跨语言音乐信息检索的统一框架。
Fotol AI是强大AI解决方案的终极中心,提供AGI技术和服务。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适