首个同时支持文生和图生的3D开源模型
AI视频生成模型,Stable Video Diffusion官网入口网址
创建和使用自定义聊天机器人,基于HuggingFace的开源模型。HuggingChat Assistants官网入口网址
基于7B参数的强大对话智能语言模型,360Zhinao-7B官网入口网址
Qwen2.5-Coder系列中的1.5B参数量级代码生成模型
Qwen2.5-Coder系列中的1.5B参数代码生成模型
开源代码语言模型,提升编程智能。DeepSeek-Coder-V2官网入口网址
高性价比的GenAI云服务,SiliconCloud官网入口网址
开源音频样本和声音设计模型,Stable Audio Open官网入口网址
开源代码语言模型,支持多编程语言。DeepSeek-Coder-V2-Lite-Instruct官网入口网址
一个拥有8200万参数的前沿文本到语音(TTS)模型。
开源大型语言模型,支持多语言和专业领域应用。
文本图像到视频生成模型
Wan2.1-T2V-14B 是一款高性能的文本到视频生成模型,支持多种视频生成任务。
Zonos-v0.1 是一款具有高保真语音克隆功能的实时文本转语音(TTS)模型。
Llasa-3B 是一个基于 LLaMA 的文本到语音合成模型,支持中英文语音生成。
ComfyUI中集成的最新视频生成模型
开源视频生成模型,支持10秒视频和更高分辨率。
HunyuanVideo-I2V 是腾讯推出的基于 HunyuanVideo 的图像到视频生成框架。
Hibiki 是一款用于流式语音翻译(即同声传译)的模型,能够实时逐块生成正确翻译。
Qwen2.5-Coder系列中的3B参数指令调优模型
YuE 是一个专注于全曲生成的开源音乐基础模型,能够根据歌词生成完整的音乐作品。
先进的文本到视频生成模型
高性能英文对话生成模型
开源代码生成语言模型
领先的指令遵循模型家族,提供开源数据、代码和配方。
一款经过优化的大型语言模型,擅长文本生成和对话。OLMo-2-1124-13B-Instruct官网入口网址
一个基于强化学习优化的大型语言模型,专注于数学问题解决能力的提升。
DeepFloyd IF是一个强大的文本到图像生成模型,能够生成高分辨率和逼真度的图像。它结合了先进的语言理解和图像生成技术,提供了多种功能,如超分辨率、风格迁移和零样本学习,DeepFloyd官网入口网址
Llasa-1B 是一个基于 LLaMA 的文本转语音 (TTS) 模型,支持中英文语音合成。
一个强大的图像到视频的生成模型,它通过创新的方法解决了AI视频合成过程中的语义准确性、清晰度和时空连续性的挑战。用户可以轻松地将静态图像转换为高质量的动态视频,生成的视频不仅清晰度高,而且时序连贯,细节丰富,具有很高的真实感和艺术性,I2VGen-XL:阿里推出的图生视频模型官网入口网址
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适