开源的语音识别和说话人分割模型推理代码
ComfyUI节点,用于MMAudio模型的音频处理
Qwen2.5-Coder系列中的7B参数代码生成模型
Qwen2.5-Coder系列中的3B参数模型,专注于代码生成与理解。
基于ESP32的AI聊天机器人项目,可实现多语言对话与声纹识别
领先的指令遵循模型家族,提供开源数据、代码和指南。
先进的文本生成模型,支持多样化任务
高性能英文文本生成模型
高分辨率、高效率的文本到图像生成框架
先进的文本生成模型,支持多样化任务,Llama-3.1-Tulu-3-8B-DPO官网入口网址
高分辨率、高效率的文本到图像生成框架,Sana_1600M_1024px官网入口网址
开源知识图谱构建模型,成本低廉,Triplex官网入口网址
个性化AI助手,记录每一刻,与AI对话获取反馈。Omi AI官网入口网址
精选全球AI前沿科技和开源产品,漫话开发者UWL.ME官网入口网址
开源AI图像生成器,功能强大且免费。Flux Image Generator官网入口网址
基于大型语言模型的高性能MacOS聊天应用,ChatMLX官网入口网址
一个可以在一次传递中生成超逼真的对话的 TTS 模型。
一个简单易用的语音克隆和语音模型训练工具。
Steiner 是一个基于合成数据训练的推理模型,旨在探索多种推理路径并自主验证。
Vibe Coder 是一款开源的 VS Code 扩展,用于探索基于语音的 AI 编程体验。
一个为LLM生成Git提交信息的插件
一个用于构建Retrieval-Augmented Generation (RAG)应用的开源项目。
一个专注于超大规模系统设计和优化的工具,提供高效解决方案。
一个基于音频驱动的实时2D聊天头像生成模型,可在仅使用CPU的设备上实现30fps的实时推理。
OmniParser 是一款通用屏幕解析工具,可将 UI 截图转换为结构化格式,提升基于 LLM 的 UI 代理性能。
开源的工业级普通话自动语音识别模型,支持多种应用场景。
YuE是一个开源的音乐生成模型,能够将歌词转化为完整的歌曲。
Janus-Pro-1B 是一个统一多模态理解和生成的自回归框架。
DeepSeek-R1-Distill-Llama-70B 是一款基于强化学习优化的大型语言模型,专注于推理和对话能力。
一款帮助用户整理房间的趣味提醒应用
与您的PDF文件进行对话
开源的先进语言模型后训练框架
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适