扩散模型

RenderNet AI

RenderNet是一款强大的AI图像生成器，可以创建具有一致性的角色，并完全控制其姿势、构图和风格。适用于游戏素材、头像生成、时尚设计和产品摄影等场景，RenderNet AI官网入口网址

Emu Video

AI驱动的文本到视频生成，Emu Video官网入口网址

Show-1

Show-1 将像素和潜在扩散模型结合起来，以实现高效的高质量文本到视频的生成，Show-1官网入口网址

Neural Network Diffusion

神经网络扩散模型实现，Neural Network Diffusion官网入口网址

X-Adapter

升级扩散模型插件通用兼容性，X-Adapter官网入口网址

Upscale-A-Video

视频超分辨率扩展模型，Upscale-A-Video官网入口网址

Diffusion Model with Perceptual Loss

基于感知损失的扩散模型，Diffusion Model with Perceptual Loss官网入口网址

MagicAnimate

Temporally Consistent Human Image Animation，MagicAnimate官网入口网址

InstructVideo

文本到视频的指导生成模型，InstructVideo官网入口网址

Generative Rendering：2D mesh

控制视频生成模型，Generative Rendering：2D mesh官网入口网址

ObjectDrop

一种通过计数事实数据集和自举监督实现真实物体删除和插入的方法，ObjectDrop官网入口网址

MOTIA

通过内在适应掌握视频外延画技术的高质量灵活方法，MOTIA官网入口网址

SLD (Self-correcting LLM-controlled Diffusion Models)

官方实现的自纠正LLM控制的扩散模型，SLD (Self-correcting LLM-controlled Diffusion Models)官网入口网址

Diffusion-RWKV

RWKV架构的可扩展扩散模型，Diffusion-RWKV官网入口网址

Sora

大规模视频生成扩散模型，Sora官网入口网址

DistriFusion

加速高分辨率扩散模型推理，DistriFusion官网入口网址

ELLA

通过LLM增强语义对齐的扩散模型适配器，ELLA官网入口网址

Video Diffusion Models

Video Diffusion Models是一种基于扩散模型的视频生成技术，能够高效快速地生成高质量的视频，满足用户对于视频生成的各种需求，Video Diffusion Models官网入口网址

ResAdapter

为扩散模型提供一致性分辨率适配，ResAdapter官网入口网址

DreamWalk

使用扩散指引对文本感知图像进行细粒度风格控制，DreamWalk官网入口网址

Make-Your-Anchor

基于扩散模型的2D虚拟形象生成框架，Make-Your-Anchor官网入口网址

VAR

Visual Autoregressive Modeling: 新的视觉生成范式，VAR官网入口网址

MuseV

视频生成模型，支持无限长度高保真虚拟人视频生成，MuseV官网入口网址

IDM-VTON

一种用于虚拟试穿任务的扩散模型，特别在真实世界场景中提高图像保真度和细节保存。IDM-VTON官网入口网址

NaturalSpeech 3

NaturalSpeech 3是一个零样本（Zero-Shot）语音合成系统，使用分解编解码器和扩散模型生成自然语音，NaturalSpeech 3官网入口网址

Imagine Flash

使用极少步骤生成高保真、多样化样本，Imagine Flash官网入口网址

EmerDiff

像素级语义知识的新兴扩散模型，EmerDiff官网入口网址

Lumina-T2X

一个统一的文本到任意模态生成框架，Lumina-T2X官网入口网址

Flash Diffusion

快速生成高质量图像的扩散模型，Flash Diffusion官网入口网址

Hallo

基于扩散模型的肖像图像动画技术，Hallo官网入口网址

Slicedit

基于文本的视频编辑技术，使用时空切片。Slicedit官网入口网址

MuLan

MuLan：为110多种语言适配多语言扩散模型，MuLan官网入口网址

OpeniTab