自监督学习

自监督学习框架，用于音视觉语音处理，AV-HuBERT官网入口网址

零样本图像编辑，一键模仿参考图像风格，MimicBrush官网入口网址

一种基于潜在扩散模型的自监督层次化化妆迁移技术

自监督触觉表示，用于基于视觉的触觉传感。

视频到声音的同步生成系统，Video-Foley官网入口网址

1.58-bit量化的先进文本到图像生成模型

创新的自监督学习模型，它通过预测视频帧的特征表示来学习视频的视觉表示。这种方法不仅能够处理视频内容，还能在图像任务上表现出色，具有广泛的应用潜力，V-JEPA官网入口网址

一个小型但功能强大的视觉语言模型，它使得资源有限的研究者和开发者也能体验到先进的视觉语言模型功能，Vary-toy官网入口网址

将静态肖像和输入音频转化为生动的动画对话视频

文鳐MaaS是一个综合性的AI模型训练平台，它通过提供易操作的界面和强大的自监督学习能力，使用户能够根据自己的特定需求快速定制和部署AI模型，文鳐MaaS官网入口网址