构建高级语音AI,由LLM提供支持,实现人类般的交互体验。
功能强大的语音离线文件转写服务
智能语音转文字工具,高效且用户友好。
极速语音识别,精准时间戳
Kimi-Audio 是一个开源音频基础模型,擅长音频理解与生成。
音刻转录是一款快速、精准、丝滑的音视频转录工具。
Whisper Turbo 是一款免费在线快速准确的语音识别工具。
端到端中英语音对话模型
AI驱动的个人电脑助手,PC Agent官网入口网址
Scribe 是全球最准确的语音转文字模型,支持99种语言。
开源的工业级普通话自动语音识别模型,支持多种应用场景。
与大型语言模型进行自然的语音对话
会议语音转文本并自动生成摘要的AI工具
联合语音转录和实体识别的先进模型
AI代理测试和评估平台
智能语音分析,提升零售客户服务体验。Encounter AI Advisor官网入口网址
DuRT 是一款 macOS 上的实时语音识别和翻译软件,致力于提供高效、准确的语音处理服务。
开源工业级自动语音识别模型,支持普通话、方言和英语,性能卓越。
智能语音旗舰应用,无障碍语言记录与交流。汉王语音王官网入口网址
音频指令演示,体验智能交互。Qwen2 Audio Instruct Demo官网入口网址
实时语音交互的人工智能对话系统。LSLM官网入口网址
Santa 2023是一款多功能的智能设备,集成了语音识别、图像识别、智能推荐等多种功能,为用户提供了全方位的智能体验,沃研Turbo大模型官网入口网址
AI驱动的语音听写工具
Android平台上的私有、设备端语音识别键盘和文字服务
基于LLM的智能字幕助手,一键生成高质量视频字幕
实时浏览器端语音识别应用
一个具有先进语音活动检测、唤醒词激活和即时转录功能的稳健、高效、低延迟的语音到文本库。
开源的语音识别和说话人分割模型推理代码
下一代语音AI,提供卓越的音频数据处理能力。
开源的全双工音频生成基础模型
多模态语音大型语言模型
实时对话式人工智能,一键式API接入。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适