扩散模型

开源视频生成模型

MakeAnything 是一个用于多领域程序化序列生成的扩散变换器模型。

可控人物图像生成模型

X-Dyna是一种基于扩散模型的零样本人类图像动画生成技术。

Pippo 是一个从单张照片生成高分辨率多人视角视频的生成模型。

高效生成一致性人物视频动画的模型

实现灵活且高保真度的图像生成，同时保持身份特征。

盲图像恢复技术，利用即时生成参考图像恢复破损图像

VideoGrain 是一种零样本方法，用于实现类别级、实例级和部件级的视频编辑。

MGIE 是苹果团队开源的一款 AI 图像编辑工具，它利用多模态大模型来增强图像编辑的指令引导能力。用户只需拍摄照片并输入文字指令，MGIE 便能够自动进行图像编辑，实现用户所需的视觉效果，MGIE官网入口网址

基于扩散模型的图像和视频生成工具

基于孪生多模态扩散变换器的创意布局到图像生成技术

基于文本生成姿态并进一步生成图像的模型

多功能大规模扩散模型，支持双向图像合成与理解。

逆向绘画技术，重现绘画过程

通过扩散模型实现单目视频的相机轨迹重定向。

一种用于零样本定制图像生成的扩散自蒸馏技术

利用扩散引导逆渲染技术实现逼真物体插入，DiPIR官网入口网址

神经模型驱动的实时游戏引擎，GameNGen官网入口网址

TokenVerse 是一种基于预训练文本到图像扩散模型的多概念个性化方法。

3D纹理生成技术，根据文本描述合成3D纹理，TexGen官网入口网址