基于Kokoro和ONNX运行时的文本到语音(TTS)项目。
PengChengStarling 是一个基于 icefall 项目的多语言自动语音识别(ASR)模型开发工具包。
YuE是一个开源的音乐生成模型,能够将歌词转化为完整的歌曲。
这是一个基于Qwen2.5-32B模型的4位量化版本,专为高效推理和低资源部署设计。
一个开源的编程助手工具,帮助开发者简化编程任务。
本地运行的人工智能代理,无缝自动化工程任务。
加速数字团队的AI驱动设计转代码、可视化编辑和企业级CMS的视觉开发平台。
一种新颖的图像到视频采样技术,基于Hunyuan模型实现高质量视频生成。
Janus-Pro-1B 是一个统一多模态理解和生成的自回归框架。
DeepSeek-R1-Distill-Llama-70B 是一款基于强化学习优化的大型语言模型,专注于推理和对话能力。
SmolVLM-500M 是一个轻量级多模态模型,能够处理图像和文本输入并生成文本输出。
一个基于文本生成图像的预训练模型,具有80亿参数和Apache 2.0开源许可。
一款基于StyleTTS 2架构的先进AI文本转语音模型,拥有8200万参数,提供高质量的自然语音合成。
Cobalt 是一个开源的流媒体下载工具,提供纯净、简洁无广告的体验。支持全平台视频、音频和图片下载,包括主流视频网站、社交媒体和音乐平台,Cobalt官网入口网址
InternLM3-8B-Instruct是一个开源的80亿参数指令模型,用于通用用途和高级推理。
AI语音代理测试与可观测性平台
一个开源的交互式开发环境,用于构建和优化基于LLM的数据处理管道。
医疗领域复杂推理的大型语言模型
一款帮助用户整理房间的趣味提醒应用
隐私优先,自托管的全开源个人知识管理系统
开源数字人课程制作平台
与您的PDF文件进行对话
开源工具,简化从非结构化文档中提取和探索结构化数据。
开源的先进语言模型后训练框架
一个用于多模型嵌入的图形库,支持多种模型和数据类型的可视化
使用AI技术,快速总结网站法律政策。
开源、自托管、AI驱动的应用构建器。
开源的协作写作Web应用
AI模型部署和推理优化的专家
开源替代品,基于搜索结果生成AI报告
高效视频生成建模的金字塔流匹配技术
开源视频生成模型
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适