增强文本与视觉任务处理能力的开源模型。
一个开源的多云平台客户端,支持LangGraph代理和前端应用开发。
NeoBase 是一款开源的 AI 数据库助手,让你用自然语言与数据库交互。
为Firefox浏览器翻译功能优化的CPU加速神经机器翻译模型。
工业级可控高效的零样本文本到语音系统
一个为LLM生成Git提交信息的插件
两个会话型AI代理在确认彼此为AI后切换到声音级协议进行通信
一个用于LLM预训练的高效网络爬虫工具,专注于高效爬取高质量网页数据。
探索大型语言模型作为编程辅导工具的潜力,提出Trace-and-Verify工作流。
隐私优先的AI会议助手,自动记录会议笔记,提升会议效率。
OmniParser 是一款通用屏幕解析工具,可将 UI 截图转换为结构化格式,提升基于 LLM 的 UI 代理性能。
开源工业级自动语音识别模型,支持普通话、方言和英语,性能卓越。
Huginn-0125是一个35亿参数的潜变量循环深度模型,擅长推理和代码生成。
EasyWeb是一个用于构建和部署与浏览器交互的AI代理的开放平台。
基于Kokoro和ONNX运行时的文本到语音(TTS)项目。
YuE是一个开源的音乐生成模型,能够将歌词转化为完整的歌曲。
这是一个基于Qwen2.5-32B模型的4位量化版本,专为高效推理和低资源部署设计。
SmolVLM-500M 是一个轻量级多模态模型,能够处理图像和文本输入并生成文本输出。
一款基于StyleTTS 2架构的先进AI文本转语音模型,拥有8200万参数,提供高质量的自然语音合成。
InternLM3-8B-Instruct是一个开源的80亿参数指令模型,用于通用用途和高级推理。
一个开源的交互式开发环境,用于构建和优化基于LLM的数据处理管道。
一个仅100行代码的极简LLM框架,使LLM能够自主编程。
一款帮助用户整理房间的趣味提醒应用
与您的PDF文件进行对话
文件解析器,专为LLMs解析PDF、Docx、PPTx等文档。
Genmo 的视频生成模型,具有高保真运动和强提示遵循性。
视频编辑工具,使用Genmo Mochi技术
微软开源的视频分词器家族
开源的语音识别和说话人分割模型推理代码
一款文本转语音工具,帮助您轻松阅读文本。
统一的开放命名实体和语音识别模型
可视化和透明的开源ChatGPT替代品
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适