AI驱动的个人电脑助手,PC Agent官网入口网址
构建高级语音AI,由LLM提供支持,实现人类般的交互体验。
功能强大的语音离线文件转写服务
趣味语音互动,让设备记住你的名字。Say My Name!官网入口网址
Kimi-Audio 是一个开源音频基础模型,擅长音频理解与生成。
多模态语音大型语言模型
将语音转换为博客文章的助手
开源的工业级普通话自动语音识别模型,支持多种应用场景。
DuRT 是一款 macOS 上的实时语音识别和翻译软件,致力于提供高效、准确的语音处理服务。
智能语音转文字工具,高效且用户友好。
实时浏览器端语音识别应用
语音驱动的AI助手,提升工作效率。
一个具有先进语音活动检测、唤醒词激活和即时转录功能的稳健、高效、低延迟的语音到文本库。
开源工业级自动语音识别模型,支持普通话、方言和英语,性能卓越。
极速语音识别,精准时间戳
Android平台上的私有、设备端语音识别键盘和文字服务
实时对话式人工智能,一键式API接入。
智能语音旗舰应用,无障碍语言记录与交流。汉王语音王官网入口网址
多模态语言模型,融合文本和语音
基于LLM的智能字幕助手,一键生成高质量视频字幕
AI代理测试和评估平台
本地部署的AI语音工具箱,支持语音识别、转录和转换。Easy Voice Toolkit官网入口网址
开源免费的 Wispr Flow 替代方案,为中文用户打造的桌面端语音输入与文本处理工具。
Scribe 是全球最准确的语音转文字模型,支持99种语言。
情感丰富的多模态语言模型
下一代语音AI,提供卓越的音频数据处理能力。
音刻转录是一款快速、精准、丝滑的音视频转录工具。
Whisper Turbo 是一款免费在线快速准确的语音识别工具。
基于ESP32的AI聊天机器人项目,可实现多语言对话与声纹识别
开源多模态大型语言模型,支持实时语音输入和流式音频输出。Mini-Omni官网入口网址
Santa 2023是一款多功能的智能设备,集成了语音识别、图像识别、智能推荐等多种功能,为用户提供了全方位的智能体验,沃研Turbo大模型官网入口网址
与大型语言模型进行自然的语音对话
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适