全新多模态推理模型,支持图文输入、文字输出,具备高精度图像感知与复杂推理能力。
一款具有 17 亿参数的开源图像生成基础模型。
为 Diffusion Transformer 提供高效灵活的控制框架。
Light-A-Video 是一种无需训练的视频重光照技术,通过渐进式光照融合实现平滑的视频重光照效果。
3D高斯生成技术,实现任意未摆姿势图像的3D重建
即时生成无版权图片
无需调优的全景多视图图像生成,PanoFree官网入口网址
Qwen2.5-Omni 是阿里云通义千问团队开发的端到端多模态模型,支持文本、音频、图像、视频输入。
AI图像生成API,提供高质量的4K图像生成和编辑功能。Picogen AI Image API官网入口网址
开放源代码的 8B 参数文本到图像扩散模型。
一个基于深度学习的图像和视频描述模型。
LLaVA-Mini是可高效理解图像、视频的大型多模态模型。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适