一个具有先进语音活动检测、唤醒词激活和即时转录功能的稳健、高效、低延迟的语音到文本库。
基于Kokoro和ONNX运行时的文本到语音(TTS)项目。
一款基于StyleTTS 2架构的先进AI文本转语音模型,拥有8200万参数,提供高质量的自然语音合成。
InternLM3-8B-Instruct是一个开源的80亿参数指令模型,用于通用用途和高级推理。
一个开源的交互式开发环境,用于构建和优化基于LLM的数据处理管道。
一个仅100行代码的极简LLM框架,使LLM能够自主编程。
开源数字人课程制作平台
开源工具,简化从非结构化文档中提取和探索结构化数据。
视频处理界面,提供视频编码和解码功能
利用AI生成的Next.js开源应用模板。
代码审查助手,确保代码无缺陷。
开源代码生成大型语言模型
Qwen2.5-Coder系列的1.5B参数指令调优模型
一款高效率的2.4亿参数轻量级语言模型
开源的RAG基础聊天工具,与文档对话。
一个提供多样化实用工具的开源平台
探索AI前沿,精选国内外AI产品与应用。
先进的医疗领域大型语言模型
300行代码实现基于LLM的语音转录。WeST官网入口网址
为Cursor.sh IDE提供AI辅助编码的开源仪表板。CursorLens官网入口网址
基于flux-dev的Deforum实现,deforum-x-flux官网入口网址
极简AI搜索引擎,助你快速获取网络信息。MiniPerplx官网入口网址
一个开源的GUI音频书和配音生成器。Pandrator官网入口网址
最简单的开源实现,nanoPerplexityAI官网入口网址
开源AI搜索引擎,提供网络搜索能力。openperplex_backend_os官网入口网址
一款现代、功能丰富的无数据库平面文件 Wiki 平台。
开源视频生成模型,支持多种生成任务。
昆仑万维开源的高性能数学代码推理模型,性能卓越
一款 21B 通用推理模型,适合低延迟应用。
PhotoDoodle 是一个基于少量样本对数据学习艺术图像编辑的代码实现。
QwQ-Max-Preview 是 Qwen 系列的最新成果,基于 Qwen2.5-Max 构建,具备强大的推理和多领域应用能力。
一种通过文本迷宫解决任务来增强大型语言模型视觉推理能力的创新方法
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适