SkyReels V1 是一个开源的人类中心视频基础模型,专注于高质量影视级视频生成。
一个专注于超大规模系统设计和优化的工具,提供高效解决方案。
开源工业级自动语音识别模型,支持普通话、方言和英语,性能卓越。
基于 PyTorch 的音乐、歌曲和音频生成工具包,支持高质量音频生成
Huginn-0125是一个35亿参数的潜变量循环深度模型,擅长推理和代码生成。
RAG-FiT是一个用于提升LLMs利用外部信息能力的库,通过特别创建的RAG增强数据集对模型进行微调。
YuE是一个开源的音乐生成模型,能够将歌词转化为完整的歌曲。
这是一个基于Qwen2.5-32B模型的4位量化版本,专为高效推理和低资源部署设计。
一种新颖的图像到视频采样技术,基于Hunyuan模型实现高质量视频生成。
SmolVLM-500M 是一个轻量级多模态模型,能够处理图像和文本输入并生成文本输出。
一个基于文本生成图像的预训练模型,具有80亿参数和Apache 2.0开源许可。
InternLM3-8B-Instruct是一个开源的80亿参数指令模型,用于通用用途和高级推理。
AI语音代理测试与可观测性平台
医疗领域复杂推理的大型语言模型
开源数字人课程制作平台
文件解析器,专为LLMs解析PDF、Docx、PPTx等文档。
开源的先进语言模型后训练框架
开源替代品,基于搜索结果生成AI报告
微软开源的视频分词器家族
开源的语音识别和说话人分割模型推理代码
一款文本转语音工具,帮助您轻松阅读文本。
统一的开放命名实体和语音识别模型
开源、注重隐私的语音助手
可视化和透明的开源ChatGPT替代品
开源代码生成大型语言模型
Qwen2.5-Coder系列的1.5B参数指令调优模型
Skywork o1 Open系列模型,提升复杂问题解决能力
MCP服务器目录,汇集多个MCP服务器资源。
一款高效率的2.4亿参数轻量级语言模型
将任何GitHub仓库转换成交互式图表,用于项目可视化。
一个开源AI模型微调与变现平台,助力AI初创企业、机器学习工程师和研究人员。
开源图像到视频生成模型
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适