语音识别 - 第 5 页 - Home

语音识别

GLM-4-Voice

端到端中英语音对话模型

构建高级语音AI，由LLM提供支持，实现人类般的交互体验。

功能强大的语音离线文件转写服务

Say My Name!

趣味语音互动，让设备记住你的名字。Say My Name!官网入口网址

Kimi-Audio 是一个开源音频基础模型，擅长音频理解与生成。

ultravox-v0_4_1-llama-3_1-70b

多模态语音大型语言模型

Robo Blogger

将语音转换为博客文章的助手

DuRT 是一款 macOS 上的实时语音识别和翻译软件，致力于提供高效、准确的语音处理服务。

开源的工业级普通话自动语音识别模型，支持多种应用场景。

智能语音转文字工具，高效且用户友好。

RealtimeSTT

一个具有先进语音活动检测、唤醒词激活和即时转录功能的稳健、高效、低延迟的语音到文本库。

Moonshine Web

实时浏览器端语音识别应用

Shortcut by Poised

语音驱动的AI助手，提升工作效率。

OmniSenseVoice

极速语音识别，精准时间戳

卡卡字幕助手

基于LLM的智能字幕助手，一键生成高质量视频字幕

汉王语音王

智能语音旗舰应用，无障碍语言记录与交流。汉王语音王官网入口网址

多模态语言模型，融合文本和语音

Transcribro

Android平台上的私有、设备端语音识别键盘和文字服务

FireRedASR-AED-L

开源工业级自动语音识别模型，支持普通话、方言和英语，性能卓越。

Deepgram Voice Agent API

实时对话式人工智能，一键式API接入。

蛐蛐 (QuQu)

开源免费的 Wispr Flow 替代方案，为中文用户打造的桌面端语音输入与文本处理工具。

情感丰富的多模态语言模型

AI代理测试和评估平台

开源多模态大型语言模型，支持实时语音输入和流式音频输出。Mini-Omni官网入口网址

Easy Voice Toolkit

本地部署的AI语音工具箱，支持语音识别、转录和转换。Easy Voice Toolkit官网入口网址

音刻转录是一款快速、精准、丝滑的音视频转录工具。

ElevenLabs Scribe

Scribe 是全球最准确的语音转文字模型，支持99种语言。

Whisper Turbo.online

Whisper Turbo 是一款免费在线快速准确的语音识别工具。

Universal-2

下一代语音AI，提供卓越的音频数据处理能力。

xiaozhi-esp32

基于ESP32的AI聊天机器人项目，可实现多语言对话与声纹识别

沃研Turbo大模型

Santa 2023是一款多功能的智能设备，集成了语音识别、图像识别、智能推荐等多种功能，为用户提供了全方位的智能体验，沃研Turbo大模型官网入口网址

Qwen2 Audio Instruct Demo

音频指令演示，体验智能交互。Qwen2 Audio Instruct Demo官网入口网址

1…3 456

AiJuh.com（AI工具集）整理了 1000+ 的AI工具，每天更新最新AI工具，AI工具集还推荐了AI学习开发的常用网站、框架和模型，帮助你进入AI时代，提高生活、工作和学习的效率！ Ctrl + D 或 ⌘ + D 收藏本站到浏览器书签栏。

关于我们网址收录
 ChatGPT中文版问小白硅基流动 Trae 绘蛙扣子Coze 白日梦AI

Copyright © 2026 Home 粤ICP备2023143650号广州市南沙区东涌如故图文设计服务部 SiteMap