音频驱动的交互式头部生成框架,用于双人对话。
基于频率分解的身份保持文本到视频生成模型
生成视频的开源模型,CogVideoX-5B官网入口网址
视频生成的轨迹导向扩散变换器,Tora官网入口网址
文本到视频的生成模型,CogVideoX官网入口网址
一个互动故事讲述的 AI 平台,通过图像和音频生成视频。
用于视频生成的下一帧预测模型。
开源视频生成模型,支持多种生成任务。
加速视频扩散模型,生成速度提升 8.5 倍。
Wan2.1-T2V-14B 是一款高性能的文本到视频生成模型,支持多种视频生成任务。
JoyGen 是一种音频驱动的 3D 深度感知的说话人脸视频编辑技术。
FlashVideo 是一个高效的高分辨率视频生成模型,专注于细节和保真度的流动。
CineMaster 是一个 3D 意识的可控文本到视频生成框架,允许用户在 3D 空间中操纵对象和相机。
Lumina-Video 是一个用于视频生成的初步尝试项目,支持文本到视频的生成。
使用AI大模型一键生成高清故事短视频,支持多种语言模型和图像生成技术。
VideoJAM 是一种用于增强视频生成模型运动连贯性的框架。
生成无限长度视频的文本条件视频生成技术
视频生成模型的时间组合性评估工具
使用Runway API,随时随地创造视频内容。
高效视频生成建模的金字塔流匹配技术
Mochi视频生成器的ComfyUI包装节点
统一可控的视频生成方法
灵感激发与视频创作平台
开源图像到视频生成模型
一种用于控制人类图像动画的方法
视频生成评估基准测试
探索AI前沿,精选国内外AI产品与应用。
WorldDreamer是一种通用世界模型,用于视频生成,能够在图像到视频合成、文本到视频生成、视频修补、视频风格化甚至动作到视频生成等方面展现出卓越的性能,视界一粟YiSu官网入口网址
MimicMotion是一款高质量的人体动作视频生成工具,通过自信的姿势引导和渐进潜在融合策略,实现任意长度视频的生成,MimicMotion官网入口网址
在视频扩散变换器中合成任何内容的框架。
GAIA-2 是一个先进的视频生成模型,用于创建安全的自动驾驶场景。
Wan2.1 是一款开源的先进大规模视频生成模型,支持多种视频生成任务。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适