功能强大的语音离线文件转写服务
基于LLM的智能字幕助手,一键生成高质量视频字幕
联合语音转录和实体识别的先进模型
下一代语音AI,提供卓越的音频数据处理能力。
开源的全双工音频生成基础模型
多模态语音大型语言模型
实时对话式人工智能,一键式API接入。
基于ESP32的AI聊天机器人项目,可实现多语言对话与声纹识别
语音驱动的AI助手,提升工作效率。
将语音转换为博客文章的助手
300行代码实现基于LLM的语音转录。WeST官网入口网址
智能语音分析,提升零售客户服务体验。Encounter AI Advisor官网入口网址
开源多模态大型语言模型,支持实时语音输入和流式音频输出。Mini-Omni官网入口网址
AI驱动的个人电脑助手,PC Agent官网入口网址
语音助手插件,提升GPT交互体验,Voice Assistant Plugin for GPT官网入口网址
实时语音交互的人工智能对话系统。LSLM官网入口网址
音刻转录是一款快速、精准、丝滑的音视频转录工具。
Phi-4-multimodal-instruct 是微软开发的轻量级多模态基础模型,支持文本、图像和音频输入。
将口语转化为优雅文字的AI写作工具,让写作变得轻松自然。
实时浏览器端语音识别应用
本地部署的AI语音工具箱,支持语音识别、转录和转换。Easy Voice Toolkit官网入口网址
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适