一个开源的聊天应用,使用Exa的API进行网络搜索,结合Deepseek R1进行推理。
使用AI技术,快速总结网站法律政策。
为LTX视频模型提供额外控制的ComfyUI节点集合
一款高效率的2.4亿参数轻量级语言模型
人脸匿名化技术,保留关键细节同时有效保护隐私。
一个用于检测幻觉的开源评估模型,基于Llama-3架构,拥有700亿参数。
将电子书转换为有声书的工具。
一个具有先进语音活动检测、唤醒词激活和即时转录功能的稳健、高效、低延迟的语音到文本库。
高分辨率、高效率的文本到图像生成框架
一款现代、功能丰富的无数据库平面文件 Wiki 平台。
一个强大的文本生成模型,适用于多种对话应用。
DeepSeek-R1-Zero 是一款通过大规模强化学习训练的推理模型,无需监督微调即可实现卓越推理能力。
开源的先进语言模型后训练框架
一款文本转语音工具,帮助您轻松阅读文本。
实时浏览器端语音识别应用
音频采样器,创造音乐节奏
先进的文本生成模型,支持多样化任务,Llama-3.1-Tulu-3-8B-DPO官网入口网址
多功能文本到多模态内容生成框架,Alpha-VLLM官网入口网址
高性能火车票查询后端系统,支持官方实时数据服务。
DeepSeek-R1-Distill-Llama-8B 是一个高性能的开源语言模型,适用于文本生成和推理任务。
DeepSeek-R1-Distill-Qwen-32B 是一款高性能的开源语言模型,适用于多种文本生成任务。
开源多模态大型语言模型,支持实时语音输入和流式音频输出。Mini-Omni官网入口网址
一个开源的GUI音频书和配音生成器。Pandrator官网入口网址
开源免费的 Wispr Flow 替代方案,为中文用户打造的桌面端语音输入与文本处理工具。
生成高质量 SVG 代码的基础模型。
工业级可控高效的零样本文本到语音系统
开源工业级自动语音识别模型,支持普通话、方言和英语,性能卓越。
PengChengStarling 是一个基于 icefall 项目的多语言自动语音识别(ASR)模型开发工具包。
本地运行的人工智能代理,无缝自动化工程任务。
一个基于文本生成图像的预训练模型,具有80亿参数和Apache 2.0开源许可。
AI语音代理测试与可观测性平台
极速语音识别,精准时间戳
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适