高质量身份保留的人像动画合成工具。
视频分析工具,结合Llama视觉模型和OpenAI Whisper进行本地视频描述生成。
用于手术视频分割的先进模型,Segment Anything 2 for Surgical Video Segmentation官网入口网址
3D人体姿态估计技术,AvatarPose官网入口网址
一种无混叠的任意尺度超分辨率方法。
通过多实例扩散模型将单张图像生成高保真度的3D场景。
为 Diffusion Transformer 提供高效灵活的控制框架。
Video Depth Anything: Consistent Depth Estimation for Super-Long Videos
一个基于深度学习的图像和视频描述模型。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适