语音处理 - 第 8 页 - Home

语音处理

Whisper Turbo.online

Whisper Turbo 是一款免费在线快速准确的语音识别工具。

轻量级端到端文本到语音模型

ClearerVoice-Studio

开源AI语音处理工具包，支持语音增强、分离和目标说话人提取。

ElevenLabs AI audio API

强大的AI音频API，提升项目互动性。ElevenLabs AI audio API官网入口网址

Voice AI Agents

定制AI语音助手解决方案，为您的日常需求提供智能解决方案。

基于大型语言模型的语音识别技术。

Qwen2 Audio Instruct Demo

音频指令演示，体验智能交互。Qwen2 Audio Instruct Demo官网入口网址

一款为 Apple Watch 设计的智能语音助手应用，无需手机即可完成多种操作。

心辰Lingo语音大模型

沟通无界，让每次对话都创造价值。

基于深度学习的高质量文本到语音合成模型

MaskGCT TTS Demo

基于MaskGCT模型的文本到语音演示

个性化AI助手，记录每一刻，与AI对话获取反馈。Omi AI官网入口网址

让获取知识和听歌一样轻松

Supertone Play

一个提供语音克隆和AI语音内容创作的平台。

300行代码实现基于LLM的语音转录。WeST官网入口网址

Voice Assistant Plugin for GPT

语音助手插件，提升GPT交互体验，Voice Assistant Plugin for GPT官网入口网址

致力于通过自然语音技术，打造个人语音伴侣和全天候可穿戴轻量级眼镜设备。

Open NotebookLM

将任何PDF转换为播客集！

AI-Powered Meeting Summarizer

会议语音转文本并自动生成摘要的AI工具

voice-chat-pdf

使用OpenAI实时API与文档进行语音聊天

AI驱动的语音笔记应用，将语音转换为有组织的摘要和清晰的行动项。

Encounter AI Advisor

智能语音分析，提升零售客户服务体验。Encounter AI Advisor官网入口网址

实时语音交互的人工智能对话系统。LSLM官网入口网址

Mumble Note

让Mumble Note将您的会议、任务、想法和快速笔记立即转换为笔记、待办事项和输出。

EaseVoice Trainer

一个简单易用的语音克隆和语音模型训练工具。

微软亚洲研究院开发的语音合成技术

Llama 3.2 3b Voice

使用Llama模型的语音合成工具

Open-LLM-VTuber

与任何大型语言模型进行快速的免提语音交互。Open-LLM-VTuber官网入口网址

Whisper-Input

Whisper Input 是一个通过按键控制语音录制并快速转译的工具。

Fish Audio文本转语音

将文本转换为自然流畅的语音输出

AI-Faceless-Video-Generator

利用AI生成视频脚本、语音和会说话的头像

pdf-to-podcast

将任何PDF文档转换成播客节目。

1…6 789 10 11