300行代码实现基于LLM的语音转录。WeST官网入口网址
开源多模态大型语言模型,支持实时语音输入和流式音频输出。Mini-Omni官网入口网址
极简AI搜索引擎,助你快速获取网络信息。MiniPerplx官网入口网址
一个开源的GUI音频书和配音生成器。Pandrator官网入口网址
开源AI搜索引擎,提供网络搜索能力。openperplex_backend_os官网入口网址
一款支持中英文的对话语音合成模型。
个人化的 AI 记忆层,确保数据安全与隐私。
Wan2.1 是一款开源的先进大规模视频生成模型,支持多种视频生成任务。
一种通过文本迷宫解决任务来增强大型语言模型视觉推理能力的创新方法
一个开源的多智能体聊天界面,支持在一个动态对话中管理多个智能体。
一个快速启动带有OpenAI集成的Django项目的模板。
EasyWeb是一个用于构建和部署与浏览器交互的AI代理的开放平台。
国内首个开源的千亿级中文对话大模型,轩辕大模型官网入口网址
首个面向语境智能的人类级实时交互系统,支持多情感、多风格语音交互。
医疗领域复杂推理的大型语言模型
开源云平台,实现超低延迟的语音和视频AI。Daily Bots官网入口网址
AI技术与纸质书的结合,让阅读体验无限扩展。BookLed官网入口网址
一个强大的统一多模态模型,支持文本到图像生成及图像编辑。
Proxy Lite 是一款开源的 3B 参数视觉语言模型(VLM),专注于网页自动化任务。
开源视频生成模型,支持多种生成任务。
昆仑万维开源的高性能数学代码推理模型,性能卓越
Pusa 是一个新颖的视频扩散模型,支持多种视频生成任务。
一个开放源代码的 14B 参数编程模型,具备高效的代码推理能力。
一款 21B 通用推理模型,适合低延迟应用。
两个会话型AI代理在确认彼此为AI后切换到声音级协议进行通信
PhotoDoodle 是一个基于少量样本对数据学习艺术图像编辑的代码实现。
QwQ-Max-Preview 是 Qwen 系列的最新成果,基于 Qwen2.5-Max 构建,具备强大的推理和多领域应用能力。
RAG-FiT是一个用于提升LLMs利用外部信息能力的库,通过特别创建的RAG增强数据集对模型进行微调。
开源、自托管、AI驱动的应用构建器。
将任何PDF转换为播客集!
开源大型语言模型工具集合
基于知识图谱的智能问答系统。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适