Show-1 将像素和潜在扩散模型结合起来,以实现高效的高质量文本到视频的生成,Show-1官网入口网址
AI驱动的文本到视频生成,Emu Video官网入口网址
RenderNet是一款强大的AI图像生成器,可以创建具有一致性的角色,并完全控制其姿势、构图和风格。适用于游戏素材、头像生成、时尚设计和产品摄影等场景,RenderNet AI官网入口网址
神经网络扩散模型实现,Neural Network Diffusion官网入口网址
升级扩散模型插件通用兼容性,X-Adapter官网入口网址
视频超分辨率扩展模型,Upscale-A-Video官网入口网址
基于感知损失的扩散模型,Diffusion Model with Perceptual Loss官网入口网址
文本到视频的指导生成模型,InstructVideo官网入口网址
Temporally Consistent Human Image Animation,MagicAnimate官网入口网址
控制视频生成模型,Generative Rendering:2D mesh官网入口网址
一种通过计数事实数据集和自举监督实现真实物体删除和插入的方法,ObjectDrop官网入口网址
官方实现的自纠正LLM控制的扩散模型,SLD (Self-correcting LLM-controlled Diffusion Models)官网入口网址
通过内在适应掌握视频外延画技术的高质量灵活方法,MOTIA官网入口网址
RWKV架构的可扩展扩散模型,Diffusion-RWKV官网入口网址
加速高分辨率扩散模型推理,DistriFusion官网入口网址
大规模视频生成扩散模型,Sora官网入口网址
通过LLM增强语义对齐的扩散模型适配器,ELLA官网入口网址
Video Diffusion Models是一种基于扩散模型的视频生成技术,能够高效快速地生成高质量的视频,满足用户对于视频生成的各种需求,Video Diffusion Models官网入口网址
使用扩散指引对文本感知图像进行细粒度风格控制,DreamWalk官网入口网址
基于扩散模型的2D虚拟形象生成框架,Make-Your-Anchor官网入口网址
为扩散模型提供一致性分辨率适配,ResAdapter官网入口网址
Visual Autoregressive Modeling: 新的视觉生成范式,VAR官网入口网址
视频生成模型,支持无限长度高保真虚拟人视频生成,MuseV官网入口网址
一种用于虚拟试穿任务的扩散模型,特别在真实世界场景中提高图像保真度和细节保存。IDM-VTON官网入口网址
NaturalSpeech 3是一个零样本(Zero-Shot)语音合成系统,使用分解编解码器和扩散模型生成自然语音,NaturalSpeech 3官网入口网址
使用极少步骤生成高保真、多样化样本,Imagine Flash官网入口网址
像素级语义知识的新兴扩散模型,EmerDiff官网入口网址
一个统一的文本到任意模态生成框架,Lumina-T2X官网入口网址
快速生成高质量图像的扩散模型,Flash Diffusion官网入口网址
基于扩散模型的肖像图像动画技术,Hallo官网入口网址
MuLan:为110多种语言适配多语言扩散模型,MuLan官网入口网址
基于文本的视频编辑技术,使用时空切片。Slicedit官网入口网址
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适