让应用通过语音与文本的转换实现智能交互。
无需对齐信息的零样本文本到语音转换模型
快速生成类人语音的TTS模型
一款通过纯语言模型实现的文本到语音合成模型
前沿AI研究和产品公司,推动通信未来。Gan.AI官网入口网址
一个简单易用的语音克隆和语音模型训练工具。
一个高效的语音合成模型,支持中英文及语音克隆。
一个开源文本转语音系统,致力于实现人类语音的自然化。
工业级可控高效的零样本文本到语音系统
基于Kokoro和ONNX运行时的文本到语音(TTS)项目。
大饼AI变声器,自然人声效果,千种音色选择,全场景接入支持,Dubbing大饼AI声音官网入口网址
AI ContentCraft 是一个多功能内容创作工具,集成了文本生成、语音合成和图像生成能力。
Llasa-1B 是一个基于 LLaMA 的文本转语音 (TTS) 模型,支持中英文语音合成。
全球唯一、多情绪、多语态、全可控的AI配音产品,Dubbingx官网入口网址
ChatTTS项目的入门指南和资源汇总。
轻量级端到端文本到语音模型
基于MaskGCT模型的文本到语音演示
端到端中英语音对话模型
开源多模态大型语言模型,支持实时语音输入和流式音频输出。Mini-Omni官网入口网址
开发者可互动体验 OpenAI API 中的新语音模型gpt-4o-transcribe, gpt-4o-mini-transcribe and gpt-4o-mini-tts。
一个用于生成对话式语音的模型,支持从文本和音频输入生成高质量的语音。
CSM 1B 是一个由 Sesame 开发的文本到语音生成模型,可生成高质量的音频。
Spark-TTS 是一种基于大语言模型的高效单流解耦语音合成模型。
将电子书转换为有声书的工具。
一个拥有8200万参数的前沿文本到语音(TTS)模型。
生成高质量中文方言语音的大规模文本到语音模型。
利用AI生成视频脚本、语音和会说话的头像
微软亚洲研究院开发的语音合成技术
使用Llama模型的语音合成工具
轻量级图片数字人驱动算法,快速定制AI伙伴
AI驱动的视频生成工具,一键生成高质量营销视频
可扩展的流媒体语音合成技术,结合大型语言模型。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适