通过语音触发Zapier自动化流程。
将任何PDF文档转换成播客节目。
基于MaskGCT模型的文本到语音演示
领先的语音数据隐私解决方案
基于LLM的智能字幕助手,一键生成高质量视频字幕
AI技术实现语音转文字和内容总结的应用
基于OpenAI Whisper的自动语音识别与说话人分割,whisper-diarization官网入口网址
前沿AI研究和产品公司,推动通信未来。Gan.AI官网入口网址
使用AI技术自动记录和转录会议内容。Minutes AI官网入口网址
实时语音交互的人工智能对话系统。LSLM官网入口网址
FoloUp 是一个用于招聘的 AI 驱动语音面试平台。
开源的工业级普通话自动语音识别模型,支持多种应用场景。
Soro是将会议语音自动转文字的AI会议记录助手。
将文本转换为逼真语音的在线工具
轻量级端到端文本到语音模型
实时语音和视频AI平台
使用Llama模型的语音合成工具
构建智能多模态语音助手的端到端框架。
开源的语音识别和说话人分割模型推理代码
基于深度学习的高质量文本到语音合成模型
声音AI分析工具,优化语音助手性能
Sandra AI,专为汽车分销设计的智能语音代理。
个性化语音克隆工具,实现自然语音生成。ChatTTS-OpenVoice官网入口网址
智能会议助手,实现会议内容实时转写与总结。
一个简单易用的语音克隆和语音模型训练工具。
Sesame AI 是一款先进的语音合成平台,能够生成自然对话式语音并具备情感智能。
一个用于生成对话式语音的模型,支持从文本和音频输入生成高质量的语音。
工业级可控高效的零样本文本到语音系统
为酒店提供多语言AI语音代理,提升客户体验并降低运营成本。
开源工业级自动语音识别模型,支持普通话、方言和英语,性能卓越。
AI驱动的深度W造和语音克隆检测平台,快速验证视频、语音和信息。
基于Kokoro和ONNX运行时的文本到语音(TTS)项目。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适