Spark-TTS 是一种基于大语言模型的高效单流解耦语音合成模型。
开发者可互动体验 OpenAI API 中的新语音模型gpt-4o-transcribe, gpt-4o-mini-transcribe and gpt-4o-mini-tts。
将电子书转换为有声书的工具。
一款通过纯语言模型实现的文本到语音合成模型
Llasa-1B 是一个基于 LLaMA 的文本转语音 (TTS) 模型,支持中英文语音合成。
大饼AI变声器,自然人声效果,千种音色选择,全场景接入支持,Dubbing大饼AI声音官网入口网址
实时对话式人工智能,一键式API接入。
高性能的文本到语音合成模型,OuteTTS-0.2-500M官网入口网址
强大的AI音频API,提升项目互动性。ElevenLabs AI audio API官网入口网址
智能词库精准翻译,18语种实时互译,会议字幕同步分享
免费的 AI 播客生成工具,支持多种格式文件。
Text to Speech.im是一款免费在线将文本转换为语音的工具,支持多种语言和语音风格,高精度语音合成,适用于视力障碍者、教育制作、广播节目等场景,TextToSpeech官网入口网址
一个用于生成对话式语音的模型,支持从文本和音频输入生成高质量的语音。
工业级可控高效的零样本文本到语音系统
基于Llama框架的TTS基础模型,兼容16万小时标记化语音数据。
基于MaskGCT模型的文本到语音演示
一个实验性的文本到语音模型
VoiceCanvas借助先进AI实现多语言文本到语音转换,具备语音克隆等特色功能,应用广泛。
开源多模态大型语言模型,支持实时语音输入和流式音频输出。Mini-Omni官网入口网址
CSM 1B 是一个由 Sesame 开发的文本到语音生成模型,可生成高质量的音频。
Zonos-v0.1-hybrid 是一款领先的开源文本转语音模型,能够提供高质量的语音合成服务。
轻量级端到端文本到语音模型
一款支持中英文的对话语音合成模型。
将文本转换为自然流畅的语音输出
基于深度学习的高质量文本到语音合成模型
一个简单易用的语音克隆和语音模型训练工具。
利用AI生成视频脚本、语音和会说话的头像
ChatTTS项目的入门指南和资源汇总。
使用Llama模型的语音合成工具
将文本转换为逼真语音的在线工具
AI驱动的视频生成工具,一键生成高质量营销视频
Sesame AI 是一款先进的语音合成平台,能够生成自然对话式语音并具备情感智能。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适