多模态大型模型,处理文本、图像和视频数据
多模态大型语言模型,展示卓越的整体性能
定制化漫画生成模型,连接多模态LLMs和扩散模型。
多模态大型语言模型,展示卓越的整体性能。
多模态12B参数模型,结合视觉编码器处理图像和文本。
国产化大模型,支持多模态,快速低成本智能化转型。
视觉语言模型的最新进展,集成微信AI的新技术
多模态大型语言模型,提升视觉与语言的交互能力。
基于文本生成图像的多模态扩散变换器模型
基于Llama-3-8B的多模态大型语言模型,专注于UI任务。
视觉语言模型,结合图像和文本信息进行智能处理。
多模态语音大型语言模型
多模态原生Mixture-of-Experts模型
Qwen2-VL-7B是最新的视觉语言模型,支持多模态理解和文本生成。
先进多模态大型语言模型系列
多模态大型语言模型,支持图像与文本的交互理解。
多模态大型语言模型,支持图像和文本理解
多模态大型语言模型,支持图像与文本的深度交互
多模态大型语言模型,融合视觉与语言理解。
视觉语言模型的最新进展
多模态大语言模型,提升多模态推理能力
多模态大型语言模型,优化图像与文本交互能力
开源多模态大型语言模型,支持实时语音输入和流式音频输出。Mini-Omni官网入口网址
SEED-Story是一款多模态长篇故事生成工具,结合文本和图像生成丰富连贯的故事,适用于故事创作和内容生成,SEED-Story官网入口网址
多模态自回归模型,擅长文本生成图像,Lumina-mGPT官网入口网址
多模态大型语言模型的优化与分析
大规模多模态推理与指令调优平台
几行代码接入大模型
一个用于信息检索和生成的灵活高性能框架
AI驱动的演示文档制作平台
124B参数的多模态大型语言模型
总奖金超 233 万!
报名即将截止