自监督学习框架,用于音视觉语音处理,AV-HuBERT官网入口网址
零样本图像编辑,一键模仿参考图像风格,MimicBrush官网入口网址
视频到声音的同步生成系统,Video-Foley官网入口网址
自监督触觉表示,用于基于视觉的触觉传感。
将静态肖像和输入音频转化为生动的动画对话视频
1.58-bit量化的先进文本到图像生成模型
一种基于潜在扩散模型的自监督层次化化妆迁移技术
总奖金超 233 万!
报名即将截止