端到端中英语音对话模型
构建高级语音AI,由LLM提供支持,实现人类般的交互体验。
功能强大的语音离线文件转写服务
趣味语音互动,让设备记住你的名字。Say My Name!官网入口网址
Kimi-Audio 是一个开源音频基础模型,擅长音频理解与生成。
多模态语音大型语言模型
将语音转换为博客文章的助手
DuRT 是一款 macOS 上的实时语音识别和翻译软件,致力于提供高效、准确的语音处理服务。
开源的工业级普通话自动语音识别模型,支持多种应用场景。
智能语音转文字工具,高效且用户友好。
一个具有先进语音活动检测、唤醒词激活和即时转录功能的稳健、高效、低延迟的语音到文本库。
实时浏览器端语音识别应用
语音驱动的AI助手,提升工作效率。
极速语音识别,精准时间戳
基于LLM的智能字幕助手,一键生成高质量视频字幕
智能语音旗舰应用,无障碍语言记录与交流。汉王语音王官网入口网址
多模态语言模型,融合文本和语音
Android平台上的私有、设备端语音识别键盘和文字服务
开源工业级自动语音识别模型,支持普通话、方言和英语,性能卓越。
实时对话式人工智能,一键式API接入。
开源免费的 Wispr Flow 替代方案,为中文用户打造的桌面端语音输入与文本处理工具。
情感丰富的多模态语言模型
AI代理测试和评估平台
开源多模态大型语言模型,支持实时语音输入和流式音频输出。Mini-Omni官网入口网址
本地部署的AI语音工具箱,支持语音识别、转录和转换。Easy Voice Toolkit官网入口网址
音刻转录是一款快速、精准、丝滑的音视频转录工具。
Scribe 是全球最准确的语音转文字模型,支持99种语言。
Whisper Turbo 是一款免费在线快速准确的语音识别工具。
下一代语音AI,提供卓越的音频数据处理能力。
基于ESP32的AI聊天机器人项目,可实现多语言对话与声纹识别
Santa 2023是一款多功能的智能设备,集成了语音识别、图像识别、智能推荐等多种功能,为用户提供了全方位的智能体验,沃研Turbo大模型官网入口网址
音频指令演示,体验智能交互。Qwen2 Audio Instruct Demo官网入口网址
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适