一种用于控制视频扩散模型运动模式的高效方法,支持运动模式的自定义和迁移。
TokenVerse 是一种基于预训练文本到图像扩散模型的多概念个性化方法。
MGIE 是苹果团队开源的一款 AI 图像编辑工具,它利用多模态大模型来增强图像编辑的指令引导能力。用户只需拍摄照片并输入文字指令,MGIE 便能够自动进行图像编辑,实现用户所需的视觉效果,MGIE官网入口网址
高效生成一致性人物视频动画的模型
开源视频生成模型
4D场景创建工具,使用多视图视频扩散模型
SeedVR: 一种用于通用视频修复的扩散变换器模型
一种支持多种视频生成控制任务的统一架构模型。
视频扩散模型,用于虚拟试穿。
基于扩散模型的图像和视频生成工具
定制化漫画生成模型,连接多模态LLMs和扩散模型。
基于孪生多模态扩散变换器的创意布局到图像生成技术
逆向绘画技术,重现绘画过程
基于文本生成姿态并进一步生成图像的模型
自适应条件选择,提升文本到图像生成控制力
利用扩散引导逆渲染技术实现逼真物体插入,DiPIR官网入口网址
X-Dyna是一种基于扩散模型的零样本人类图像动画生成技术。
一个创新的多语言视觉文本生成和编辑工具,利用先进的扩散模型技术,能够准确生成和编辑图像中的文本。它不仅支持多种语言和文本风格,还能在复杂的图像背景中保持文本的清晰度和一致性,为用户提供了强大的文本处理能力,AnyText官网入口网址
3D纹理生成技术,根据文本描述合成3D纹理,TexGen官网入口网址
加速视频扩散模型,生成速度提升 8.5 倍。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适