一个拥有8200万参数的前沿文本到语音(TTS)模型。
ComfyUI中集成的最新视频生成模型
开源的全双工音频生成基础模型
Qwen2.5-Coder系列的3B参数指令调优模型
Qwen2.5-Coder系列中的1.5B参数代码生成模型
开源AI辅助编程模型系列
高性能英文对话生成模型
开源视频生成模型,支持10秒视频和更高分辨率。
开源代码生成语言模型
领先的指令遵循模型家族,提供开源数据、代码和指南。
开源幻觉评估模型
文本到视频的生成模型,CogVideoX官网入口网址
HunyuanVideo-I2V 是腾讯推出的基于 HunyuanVideo 的图像到视频生成框架。
Wan2.1-T2V-14B 是一款高性能的文本到视频生成模型,支持多种视频生成任务。
SkyReels-V1 是首个开源的人类中心视频基础模型,专注于高质量视频生成。
DeepFloyd IF是一个强大的文本到图像生成模型,能够生成高分辨率和逼真度的图像。它结合了先进的语言理解和图像生成技术,提供了多种功能,如超分辨率、风格迁移和零样本学习,DeepFloyd官网入口网址
在图像理解和文本处理任务上展现出卓越的性能,并通过定制化微调和本地部署,推动了AI技术的开放性和可访问性,Llama 3.2官网入口网址
Qwen2.5-Coder系列中的3B参数量指令调优模型
一个开源的视频生成模型,用于创造生动的视频内容。CogVideoX-2B官网入口网址
一款具有 17 亿参数的开源图像生成基础模型。
PIKE-RAG 是一种专注于领域知识和推理增强生成的模型。
提供高级 AI 聊天体验,完全私密。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适