趣味语音互动,让设备记住你的名字。Say My Name!官网入口网址
使用AI技术自动记录和转录会议内容。Minutes AI官网入口网址
功能强大的语音离线文件转写服务
AI驱动的个人电脑助手,PC Agent官网入口网址
极速语音识别,精准时间戳
Spark-TTS 是一种基于大语言模型的高效单流解耦语音合成模型。
AI语音代理测试与可观测性平台
开源AI语音处理工具包,支持语音增强、分离和目标说话人提取。
Soro是将会议语音自动转文字的AI会议记录助手。
构建智能多模态语音助手的端到端框架。
AI语音转文字助手,支持99种语言
开源的工业级普通话自动语音识别模型,支持多种应用场景。
统一的开放命名实体和语音识别模型
强大的AI音频API,提升项目互动性。ElevenLabs AI audio API官网入口网址
MiniCPM-o 2.6是一个强大的多模态大型语言模型,适用于视觉、语音和多模态直播。
一款文本转语音工具,帮助您轻松阅读文本。
TypeScript客户端,用于OpenAI的实时语音API。
高精度视频唇形同步技术
基于MaskGCT模型的文本到语音演示
Scribe 是全球最准确的语音转文字模型,支持99种语言。
一款为 Apple Watch 设计的智能语音助手应用,无需手机即可完成多种操作。
Whisper Input 是一个通过按键控制语音录制并快速转译的工具。
使用OpenAI实时API与文档进行语音聊天
联合语音转录和实体识别的先进模型
个性化语音克隆工具,实现自然语音生成。ChatTTS-OpenVoice官网入口网址
基于羊驼模型的大型语音生成模型,LlamaVoice官网入口网址
音刻转录是一款快速、精准、丝滑的音视频转录工具。
工业级可控高效的零样本文本到语音系统
致力于通过自然语音技术,打造个人语音伴侣和全天候可穿戴轻量级眼镜设备。
基于Llama框架的TTS基础模型,兼容16万小时标记化语音数据。
将电子书转换为有声书的工具。
一个具有先进语音活动检测、唤醒词激活和即时转录功能的稳健、高效、低延迟的语音到文本库。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适