语音合成

声咔AI配音

声咔AI配音是在线配音软件平台，垂直深度音频效率工具，支持30多种个性化调音功能等，限制少对用户友好，声咔AI配音官网入口网址

audiblez

将电子书转换为有声书的工具。

OuteTTS-0.1-350M

一款通过纯语言模型实现的文本到语音合成模型

FlowSpeech

免费的 AI 播客生成工具，支持多种格式文件。

Llasa-1B

Llasa-1B 是一个基于 LLaMA 的文本转语音 (TTS) 模型，支持中英文语音合成。

OpenAI.fm

开发者可互动体验 OpenAI API 中的新语音模型gpt-4o-transcribe， gpt-4o-mini-transcribe and gpt-4o-mini-tts。

Dubbing大饼AI声音

大饼AI变声器，自然人声效果，千种音色选择，全场景接入支持，Dubbing大饼AI声音官网入口网址

数译AI同传

智能词库精准翻译，18语种实时互译，会议字幕同步分享

Sesame CSM

一个用于生成对话式语音的模型，支持从文本和音频输入生成高质量的语音。

IndexTTS

工业级可控高效的零样本文本到语音系统

Deepgram Voice Agent API

实时对话式人工智能，一键式API接入。

OuteTTS-0.2-500M

高性能的文本到语音合成模型，OuteTTS-0.2-500M官网入口网址

Mini-Omni

开源多模态大型语言模型，支持实时语音输入和流式音频输出。Mini-Omni官网入口网址

TextToSpeech

Text to Speech.im是一款免费在线将文本转换为语音的工具，支持多种语言和语音风格，高精度语音合成，适用于视力障碍者、教育制作、广播节目等场景，TextToSpeech官网入口网址

Llasa

基于Llama框架的TTS基础模型，兼容16万小时标记化语音数据。

ElevenLabs AI audio API

强大的AI音频API，提升项目互动性。ElevenLabs AI audio API官网入口网址

VoiceCanvas

VoiceCanvas借助先进AI实现多语言文本到语音转换，具备语音克隆等特色功能，应用广泛。

kokoro-onnx

基于Kokoro和ONNX运行时的文本到语音（TTS）项目。

OptiSpeech

轻量级端到端文本到语音模型

OuteTTS

一个实验性的文本到语音模型

MaskGCT TTS Demo

基于MaskGCT模型的文本到语音演示

CSM 1B

CSM 1B 是一个由 Sesame 开发的文本到语音生成模型，可生成高质量的音频。

MOSS-TTSD

一款支持中英文的对话语音合成模型。

小视频宝

AI驱动的视频生成工具，一键生成高质量营销视频

Zonos-v0.1-hybrid

Zonos-v0.1-hybrid 是一款领先的开源文本转语音模型，能够提供高质量的语音合成服务。

F5-TTS

基于深度学习的高质量文本到语音合成模型

EaseVoice Trainer

一个简单易用的语音克隆和语音模型训练工具。

Awesome-ChatTTS

ChatTTS项目的入门指南和资源汇总。

Fish Audio文本转语音

将文本转换为自然流畅的语音输出

AI-Faceless-Video-Generator

利用AI生成视频脚本、语音和会说话的头像

VALL-E 2

微软亚洲研究院开发的语音合成技术

Llama 3.2 3b Voice

使用Llama模型的语音合成工具

OpeniTab