Falcon 2 是一款开源、多语言、多模态的模型,具备图像到文本转换能力。Falcon 2官网入口网址
革命性AI技术,多模态智能互动,GPT4o.so官网入口网址
大型视频语言模型,用于视觉问答和视频字幕生成。VideoLLaMA2-7B-16F-Base官网入口网址
微软轻量级、先进的多模态模型,专注于文本和视觉的高质量推理密集数据。Phi-3-vision-128k-instruct官网入口网址
开源多模态预训练模型,具备中英双语对话能力。GLM-4V-9B官网入口网址
专为内容创作者设计的AI内容搜索引擎,Qmedia官网入口网址
大型视频-语言模型,提供视觉问答和视频字幕生成。VideoLLaMA2-7B官网入口网址
大型多模态模型,处理多图像、视频和3D数据。LLaVA-NeXT官网入口网址
统一的代码库,用于微调大型多模态模型,lmms-finetune官网入口网址
先进的多模态大型语言模型,具备卓越的多模态推理能力。
先进的多模态模型,支持图像和文本理解。Phi-3.5-vision官网入口网址
大规模多模态医学数据集,MedTrinity-25M官网入口网址
SiliconFlow(硅基流动)是生成式AI计算基础设施平台。SiliconFlow提供包括SiliconLLM大模型推理引擎、OneDiff高性能文生图/视频加速库,及SiliconCloud模型云服务平台等产品,降低AI模型部署和推理成本,提升用户体验。
多语言多模态嵌入模型,用于文本和图像检索。jina-clip-v2官网入口网址
自然语言编程,快速构建AI应用,Wordware官网入口网址
高性能多模态语言模型,适用于图像和视频理解。MiniCPM-V 2.6官网入口网址
MMTryon是一款多模态多参考虚拟试衣框架,能够生成高质量的组合试穿结果,支持多种试穿物品和穿衣风格定制,MMTryon官网入口网址
MiniCPM-o 2.6是一个强大的多模态大型语言模型,适用于视觉、语音和多模态直播。
InternVL2.5-MPO系列模型,基于InternVL2.5和混合偏好优化,展现卓越性能。
现代Python数据框库,专为人工智能设计。
下一代多模态智能模型
多模态原生混合专家模型
低延迟、高质量的端到端语音交互模型
情感丰富的多模态语言模型
低延迟的实时语音交互API
多模态语言模型,融合文本和语音
统一文本、音乐和动作生成模型
轻量级语言模型编程库,将提示视为函数。
先进的多模态图像生成模型,结合文本提示和视觉参考生成高质量图像。
先进的多模态大型语言模型系列
WePOINTS项目,提供多模态模型的统一框架
先进的多模态大型语言模型
总奖金超 233 万!
报名即将截止