与任何大型语言模型进行快速的免提语音交互。Open-LLM-VTuber官网入口网址
一个用于生成对话式语音的模型,支持从文本和音频输入生成高质量的语音。
FoloUp 是一个用于招聘的 AI 驱动语音面试平台。
AI驱动的深度W造和语音克隆检测平台,快速验证视频、语音和信息。
LLaSA: 扩展基于 LLaMA 的语音合成的训练时间和测试时间计算量
MiniCPM-o 2.6是一个强大的多模态大型语言模型,适用于视觉、语音和多模态直播。
通过语音触发Zapier自动化流程。
轻量级端到端文本到语音模型
微软亚洲研究院开发的语音合成技术
将任何PDF文档转换成播客节目。
开源的语音识别和说话人分割模型推理代码
基于LLM的智能字幕助手,一键生成高质量视频字幕
高效、多语种的语音合成模型
基于OpenAI Whisper的自动语音识别与说话人分割,whisper-diarization官网入口网址
前沿AI研究和产品公司,推动通信未来。Gan.AI官网入口网址
个性化AI助手,记录每一刻,与AI对话获取反馈。Omi AI官网入口网址
使用AI技术自动记录和转录会议内容。Minutes AI官网入口网址
一站式生活助手,整合日程、提醒、记事、购物、天气等多功能。Hero App官网入口网址
基于羊驼模型的大型语音生成模型,LlamaVoice官网入口网址
实时语音交互的人工智能对话系统。LSLM官网入口网址
智能会议助手,实现会议内容实时转写与总结。
一个简单易用的语音克隆和语音模型训练工具。
Sesame AI 是一款先进的语音合成平台,能够生成自然对话式语音并具备情感智能。
为酒店提供多语言AI语音代理,提升客户体验并降低运营成本。
开源的工业级普通话自动语音识别模型,支持多种应用场景。
Whisper Input 是一个通过按键控制语音录制并快速转译的工具。
实验室数字化助手,提升科研效率。
个性化AI唤醒服务,助你早起。
沟通无界,让每次对话都创造价值。
精确到词级的自动语音识别模型
利用AI生成视频脚本、语音和会说话的头像
情感丰富的多模态语言模型
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适