自动语音识别工具,提供词级时间戳和说话人识别
与任何大型语言模型进行快速的免提语音交互。Open-LLM-VTuber官网入口网址
基于羊驼模型的大型语音生成模型,LlamaVoice官网入口网址
实时语音交互的人工智能对话系统。LSLM官网入口网址
免费的 AI 播客生成工具,支持多种格式文件。
工业级可控高效的零样本文本到语音系统
Scribe 是全球最准确的语音转文字模型,支持99种语言。
开源工业级自动语音识别模型,支持普通话、方言和英语,性能卓越。
精确到词级的自动语音识别模型
会议语音转文本并自动生成摘要的AI工具
使用OpenAI实时API与文档进行语音聊天
智能语音分析,提升零售客户服务体验。Encounter AI Advisor官网入口网址
音频指令演示,体验智能交互。Qwen2 Audio Instruct Demo官网入口网址
将电子书转换为有声书的工具。
一个具有先进语音活动检测、唤醒词激活和即时转录功能的稳健、高效、低延迟的语音到文本库。
Whisper Input 是一个通过按键控制语音录制并快速转译的工具。
基于深度学习的高质量文本到语音合成模型
AI驱动的语音听写工具
基于LLM的智能字幕助手,一键生成高质量视频字幕
Sesame AI 是一款先进的语音合成平台,能够生成自然对话式语音并具备情感智能。
一个提供语音克隆和AI语音内容创作的平台。
通过语音触发Zapier自动化流程。
利用AI生成视频脚本、语音和会说话的头像
开源的语音识别和说话人分割模型推理代码
Android平台上的私有、设备端语音识别键盘和文字服务
实时浏览器端语音识别应用
前沿AI研究和产品公司,推动通信未来。Gan.AI官网入口网址
个性化AI助手,记录每一刻,与AI对话获取反馈。Omi AI官网入口网址
用PERSO.ai轻松本地化视频,实现无缝AI配音、声音克隆和口型同步 - 轻松吸引全球观众。
LLaSA: 扩展基于 LLaMA 的语音合成的训练时间和测试时间计算量
轻量级端到端文本到语音模型
实时语音和视频AI平台
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适