强大的AI音频API,提升项目互动性。ElevenLabs AI audio API官网入口网址
AI语音转文字助手,支持99种语言
音刻转录是一款快速、精准、丝滑的音视频转录工具。
极速语音识别,精准时间戳
基于Llama框架的TTS基础模型,兼容16万小时标记化语音数据。
Whisper Turbo 是一款免费在线快速准确的语音识别工具。
语音转文字的智能助手
与任何大型语言模型进行快速的免提语音交互。Open-LLM-VTuber官网入口网址
PengChengStarling 是一个基于 icefall 项目的多语言自动语音识别(ASR)模型开发工具包。
将文本转换为自然流畅的语音输出
会议语音转文本并自动生成摘要的AI工具
一款文本转语音工具,帮助您轻松阅读文本。
统一的开放命名实体和语音识别模型
开源AI语音处理工具包,支持语音增强、分离和目标说话人提取。
AI语音代理测试与可观测性平台
与大型语言模型进行自然的语音对话
高精度视频唇形同步技术
智能语音分析,提升零售客户服务体验。Encounter AI Advisor官网入口网址
音频指令演示,体验智能交互。Qwen2 Audio Instruct Demo官网入口网址
基于羊驼模型的大型语音生成模型,LlamaVoice官网入口网址
Scribe 是全球最准确的语音转文字模型,支持99种语言。
致力于通过自然语音技术,打造个人语音伴侣和全天候可穿戴轻量级眼镜设备。
功能强大的语音离线文件转写服务
TypeScript客户端,用于OpenAI的实时语音API。
AI驱动的语音听写工具
Android平台上的私有、设备端语音识别键盘和文字服务
联合语音转录和实体识别的先进模型
自动语音识别工具,提供词级时间戳和说话人识别
个性化AI助手,记录每一刻,与AI对话获取反馈。Omi AI官网入口网址
一个提供语音克隆和AI语音内容创作的平台。
一款为 Apple Watch 设计的智能语音助手应用,无需手机即可完成多种操作。
MiniCPM-o 2.6是一个强大的多模态大型语言模型,适用于视觉、语音和多模态直播。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适