零样本学习

开源的实时语音克隆技术，OpenVoice官网入口网址

无需代码或训练数据即可建立强大的计算机视觉模型，Computer Vision with DirectAI官网入口网址

Yuan 1.0是一个具有245B个参数的大规模预训练语言模型，通过零样本学习和少样本学习，在自然语言处理任务上取得了最先进的结果，具有强大的自然语言生成能力，Yuan 1官网入口网址

NaturalSpeech 3是一个零样本（Zero-Shot）语音合成系统，使用分解编解码器和扩散模型生成自然语音，NaturalSpeech 3官网入口网址

基于文本的视频编辑技术，使用时空切片。Slicedit官网入口网址

零样本图像编辑，一键模仿参考图像风格，MimicBrush官网入口网址

DeepFloyd IF是一个强大的文本到图像生成模型，能够生成高分辨率和逼真度的图像。它结合了先进的语言理解和图像生成技术，提供了多种功能，如超分辨率、风格迁移和零样本学习，DeepFloyd官网入口网址

高效自动语音识别模型

零样本风格化情侣肖像创作

X-Dyna是一种基于扩散模型的零样本人类图像动画生成技术。

VideoGrain 是一种零样本方法，用于实现类别级、实例级和部件级的视频编辑。

Voicebox 是由 Meta AI 研究团队开发的一款领先的语音生成模型。Voicebox 能够在六种语言中合成语音，消除瞬态噪声，编辑内容，在语言之间转移音频风格，并生成多样的语音样本。此外，它生成语音的速度比最先进的自回归模型快 20 倍，Voicebox官网入口网址

一种用于零样本定制图像生成的扩散自蒸馏技术

Level-Navi Agent是一个无需训练即可使用的框架，利用大语言模型进行深度查询理解和精准搜索。

一个强大的音乐生成工具，它通过先进的技术手段，如自回归模型和扩散模型，为用户提供了从音乐创作到编辑再到声音转换的全方位服务。这套系统不仅能够生成高质量的音乐作品，还能够根据用户的个性化需求进行细致的调整，极大地提高了音乐制作的灵活性和创造性，Seed Music官网入口网址

零样本声音转换技术，实现音质与音色的高保真转换。

无需对齐信息的零样本文本到语音转换模型

音乐生成系统，支持多语言声乐生成和音乐编辑。

MultiOn的Agent Q为自主网络代理设定了一个新的重要里程碑，结合了先进的搜索技术、AI自我批评和强化学习来克服当前的限制，代表着自主代理能力的重大飞跃，Agent Q官网入口网址