Spark-TTS 是一种基于大语言模型的高效单流解耦语音合成模型。
Llasa-3B 是一个基于 LLaMA 的文本到语音合成模型,支持中英文语音生成。
将文本转换为自然流畅的语音输出
免费的 AI 播客生成工具,支持多种格式文件。
基于深度学习的高质量文本到语音合成模型
快速生成类人语音的TTS模型
端到端中英语音对话模型
一款通过纯语言模型实现的文本到语音合成模型
Text to Speech.im是一款免费在线将文本转换为语音的工具,支持多种语言和语音风格,高精度语音合成,适用于视力障碍者、教育制作、广播节目等场景,TextToSpeech官网入口网址
Llasa-1B 是一个基于 LLaMA 的文本转语音 (TTS) 模型,支持中英文语音合成。
一个实验性的文本到语音模型
高性能的文本到语音合成模型,OuteTTS-0.2-500M官网入口网址
前沿AI研究和产品公司,推动通信未来。Gan.AI官网入口网址
一个高效的语音合成模型,支持中英文及语音克隆。
Sesame AI 是一款先进的语音合成平台,能够生成自然对话式语音并具备情感智能。
实时对话式人工智能,一键式API接入。
EmotiVoice 😊是一个多音色和语音控制的TTS引擎,可以将文本转换为带有不同情感的语音,EmotiVoice-Plus官网入口网址
开发者可互动体验 OpenAI API 中的新语音模型gpt-4o-transcribe, gpt-4o-mini-transcribe and gpt-4o-mini-tts。
CSM 1B 是一个由 Sesame 开发的文本到语音生成模型,可生成高质量的音频。
工业级可控高效的零样本文本到语音系统
Zonos-v0.1-hybrid 是一款领先的开源文本转语音模型,能够提供高质量的语音合成服务。
AI ContentCraft 是一个多功能内容创作工具,集成了文本生成、语音合成和图像生成能力。
将文本转换为逼真语音的在线工具
轻量级端到端文本到语音模型
使用Llama模型的语音合成工具
真人级AI语音库,支持二次元角色配音,多语言智能合成
一款支持中英文的对话语音合成模型。
一个简单易用的语音克隆和语音模型训练工具。
一个用于生成对话式语音的模型,支持从文本和音频输入生成高质量的语音。
将电子书转换为有声书的工具。
基于Kokoro和ONNX运行时的文本到语音(TTS)项目。
LLaSA: 扩展基于 LLaMA 的语音合成的训练时间和测试时间计算量
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适