端侧全模态理解开源模型
AI代理测试和评估平台
基于OpenAI Whisper的自动语音识别与说话人分割,whisper-diarization官网入口网址
实时语音交互的人工智能对话系统。LSLM官网入口网址
一个具有先进语音活动检测、唤醒词激活和即时转录功能的稳健、高效、低延迟的语音到文本库。
将口语转化为优雅文字的AI写作工具,让写作变得轻松自然。
情感丰富的多模态语言模型
AI驱动的语音笔记应用,将语音转换为有组织的摘要和清晰的行动项。
多模态语言模型,融合文本和语音
语音驱动的AI助手,提升工作效率。
将语音转换为博客文章的助手
300行代码实现基于LLM的语音转录。WeST官网入口网址
最新多模态检查点,提升语音理解能力。Llama3-s v0.2官网入口网址
AI驱动的个人电脑助手,PC Agent官网入口网址
基于大型语言模型的语音识别技术。
实时浏览器端语音识别应用
语音助手插件,提升GPT交互体验,Voice Assistant Plugin for GPT官网入口网址
亚马逊全新基础模型理解语气、语调与节奏,提升人机对话自然度。
打造各类智能云服务器、智能终端以及智能机器人的核心处理器芯片,寒武纪官网入口网址
开源多模态大型语言模型,支持实时语音输入和流式音频输出。Mini-Omni官网入口网址
本地部署的AI语音工具箱,支持语音识别、转录和转换。Easy Voice Toolkit官网入口网址
多模态语音大型语言模型
Phi-4-multimodal-instruct 是微软开发的轻量级多模态基础模型,支持文本、图像和音频输入。
让Mumble Note将您的会议、任务、想法和快速笔记立即转换为笔记、待办事项和输出。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适