Soro是将会议语音自动转文字的AI会议记录助手。
开源多模态大型语言模型,支持实时语音输入和流式音频输出。Mini-Omni官网入口网址
音频指令演示,体验智能交互。Qwen2 Audio Instruct Demo官网入口网址
沟通无界,让每次对话都创造价值。
轻量级端到端文本到语音模型
与任何大型语言模型进行快速的免提语音交互。Open-LLM-VTuber官网入口网址
个性化AI助手,记录每一刻,与AI对话获取反馈。Omi AI官网入口网址
定制AI语音助手解决方案,为您的日常需求提供智能解决方案。
一个提供语音克隆和AI语音内容创作的平台。
将文本转换为自然流畅的语音输出
基于深度学习的高质量文本到语音合成模型
开源AI语音处理工具包,支持语音增强、分离和目标说话人提取。
语音助手插件,提升GPT交互体验,Voice Assistant Plugin for GPT官网入口网址
一个简单易用的语音克隆和语音模型训练工具。
利用AI生成视频脚本、语音和会说话的头像
300行代码实现基于LLM的语音转录。WeST官网入口网址
智能语音分析,提升零售客户服务体验。Encounter AI Advisor官网入口网址
一款为 Apple Watch 设计的智能语音助手应用,无需手机即可完成多种操作。
使用Llama模型的语音合成工具
将任何PDF转换为播客集!
AI驱动的语音笔记应用,将语音转换为有组织的摘要和清晰的行动项。
通过AI语音播报,让您听取您保存的文章。
让Mumble Note将您的会议、任务、想法和快速笔记立即转换为笔记、待办事项和输出。
智能AI语音代理,自然对话,多语言支持,用于业务通话自动化。
将文本转换为逼真语音的在线工具
基于大型语言模型的语音识别技术。
会议语音转文本并自动生成摘要的AI工具
构建智能多模态语音助手的端到端框架。
开源的语音识别和说话人分割模型推理代码
使用OpenAI实时API与文档进行语音聊天
AI驱动的语音听写工具
联合语音转录和实体识别的先进模型
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适