强大的AI音频API,提升项目互动性。ElevenLabs AI audio API官网入口网址
基于Llama框架的TTS基础模型,兼容16万小时标记化语音数据。
PengChengStarling 是一个基于 icefall 项目的多语言自动语音识别(ASR)模型开发工具包。
将文本转换为自然流畅的语音输出
极速语音识别,精准时间戳
音刻转录是一款快速、精准、丝滑的音视频转录工具。
Whisper Turbo 是一款免费在线快速准确的语音识别工具。
Scribe 是全球最准确的语音转文字模型,支持99种语言。
TypeScript客户端,用于OpenAI的实时语音API。
Android平台上的私有、设备端语音识别键盘和文字服务
联合语音转录和实体识别的先进模型
开源AI语音处理工具包,支持语音增强、分离和目标说话人提取。
致力于通过自然语音技术,打造个人语音伴侣和全天候可穿戴轻量级眼镜设备。
将文本转换为逼真语音的在线工具
语音转文字的智能助手
会议语音转文本并自动生成摘要的AI工具
基于深度学习的高质量文本到语音合成模型
基于MaskGCT模型的文本到语音演示
AI技术实现语音转文字和内容总结的应用
音频指令演示,体验智能交互。Qwen2 Audio Instruct Demo官网入口网址
FoloUp 是一个用于招聘的 AI 驱动语音面试平台。
LLaSA: 扩展基于 LLaMA 的语音合成的训练时间和测试时间计算量
一款文本转语音工具,帮助您轻松阅读文本。
功能强大的语音离线文件转写服务
AI驱动的语音听写工具
AI语音转文字助手,支持99种语言
统一的开放命名实体和语音识别模型
高效、多语种的语音合成模型
与任何大型语言模型进行快速的免提语音交互。Open-LLM-VTuber官网入口网址
基于羊驼模型的大型语音生成模型,LlamaVoice官网入口网址
Sesame AI 是一款先进的语音合成平台,能够生成自然对话式语音并具备情感智能。
一个提供语音克隆和AI语音内容创作的平台。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适