自监督学习框架,用于音视觉语音处理,AV-HuBERT官网入口网址
零样本图像编辑,一键模仿参考图像风格,MimicBrush官网入口网址
视频到声音的同步生成系统,Video-Foley官网入口网址
文鳐MaaS是一个综合性的AI模型训练平台,它通过提供易操作的界面和强大的自监督学习能力,使用户能够根据自己的特定需求快速定制和部署AI模型,文鳐MaaS官网入口网址
一个小型但功能强大的视觉语言模型,它使得资源有限的研究者和开发者也能体验到先进的视觉语言模型功能,Vary-toy官网入口网址
创新的自监督学习模型,它通过预测视频帧的特征表示来学习视频的视觉表示。这种方法不仅能够处理视频内容,还能在图像任务上表现出色,具有广泛的应用潜力,V-JEPA官网入口网址
自监督触觉表示,用于基于视觉的触觉传感。
将静态肖像和输入音频转化为生动的动画对话视频
1.58-bit量化的先进文本到图像生成模型
一种基于潜在扩散模型的自监督层次化化妆迁移技术
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适