开源模型

腾讯混元3D

首个同时支持文生和图生的3D开源模型

Stable Video Diffusion

AI视频生成模型，Stable Video Diffusion官网入口网址

HuggingChat Assistants

创建和使用自定义聊天机器人，基于HuggingFace的开源模型。HuggingChat Assistants官网入口网址

360Zhinao-7B

基于7B参数的强大对话智能语言模型，360Zhinao-7B官网入口网址

Qwen2.5-Coder-1.5B-Instruct-GPTQ-Int4

Qwen2.5-Coder系列中的1.5B参数量级代码生成模型

Qwen2.5-Coder-1.5B-Instruct

Qwen2.5-Coder系列中的1.5B参数代码生成模型

DeepSeek-Coder-V2

开源代码语言模型，提升编程智能。DeepSeek-Coder-V2官网入口网址

SiliconCloud

高性价比的GenAI云服务，SiliconCloud官网入口网址

Dreamomni2

统一的多模态AI，支持基于指令的图像编辑与生成，超越商业模型。

Stable Audio Open

开源音频样本和声音设计模型，Stable Audio Open官网入口网址

DeepSeek-Coder-V2-Lite-Instruct

开源代码语言模型，支持多编程语言。DeepSeek-Coder-V2-Lite-Instruct官网入口网址

Kokoro-82M

一个拥有8200万参数的前沿文本到语音（TTS）模型。

YuE

YuE 是一个专注于全曲生成的开源音乐基础模型，能够根据歌词生成完整的音乐作品。

Wan2.1-T2V-14B

Wan2.1-T2V-14B 是一款高性能的文本到视频生成模型，支持多种视频生成任务。

Allegro-TI2V

文本图像到视频生成模型

Llasa-3B

Llasa-3B 是一个基于 LLaMA 的文本到语音合成模型，支持中英文语音生成。

Llasa-1B

Llasa-1B 是一个基于 LLaMA 的文本转语音 (TTS) 模型，支持中英文语音合成。

CogVideoX1.5-5B-SAT

开源视频生成模型，支持10秒视频和更高分辨率。

Mochi in ComfyUI

ComfyUI中集成的最新视频生成模型

hertz-dev

开源的全双工音频生成基础模型

SkyReels-V1

SkyReels-V1 是首个开源的人类中心视频基础模型，专注于高质量视频生成。

HunyuanVideo-I2V

HunyuanVideo-I2V 是腾讯推出的基于 HunyuanVideo 的图像到视频生成框架。

Qwen2.5-Coder-32B-Instruct-GPTQ-Int8

开源代码生成语言模型

StarCoder 2

一个强大的代码生成和理解工具，它通过大规模训练和多样化的模型规模，为开发者提供了一个高性能的编程辅助平台，StarCoder 2官网入口网址

Qwen2.5

开源大型语言模型，支持多语言和专业领域应用。

Lumina-Video

Lumina-Video 是一个用于视频生成的初步尝试项目，支持文本到视频的生成。

Hibiki

Hibiki 是一款用于流式语音翻译（即同声传译）的模型，能够实时逐块生成正确翻译。

Qwen2.5-Coder-1.5B-Instruct-AWQ

Qwen2.5-Coder系列中的1.5B参数代码生成模型

DeepFloyd

DeepFloyd IF是一个强大的文本到图像生成模型，能够生成高分辨率和逼真度的图像。它结合了先进的语言理解和图像生成技术，提供了多种功能，如超分辨率、风格迁移和零样本学习，DeepFloyd官网入口网址

HiDream-I1

一款具有 17 亿参数的开源图像生成基础模型。

CSM 1B

CSM 1B 是一个由 Sesame 开发的文本到语音生成模型，可生成高质量的音频。

Zonos-v0.1

Zonos-v0.1 是一款具有高保真语音克隆功能的实时文本转语音（TTS）模型。

OpeniTab