为酒店提供多语言AI语音代理,提升客户体验并降低运营成本。
一款为 Apple Watch 设计的智能语音助手应用,无需手机即可完成多种操作。
开源的工业级普通话自动语音识别模型,支持多种应用场景。
AI语音代理测试与可观测性平台
MiniCPM-o 2.6是一个强大的多模态大型语言模型,适用于视觉、语音和多模态直播。
实验室数字化助手,提升科研效率。
与大型语言模型进行自然的语音对话
沟通无界,让每次对话都创造价值。
微软亚洲研究院开发的语音合成技术
将任何PDF文档转换成播客节目。
低延迟的实时语音交互API
开源的语音识别和说话人分割模型推理代码
使用OpenAI实时API与文档进行语音聊天
使用AI整理和提炼你的想法的语音和文本笔记应用
高精度视频唇形同步技术
无需对齐信息的零样本文本到语音转换模型
领先的语音数据隐私解决方案
基于OpenAI Whisper的自动语音识别与说话人分割,whisper-diarization官网入口网址
前沿AI研究和产品公司,推动通信未来。Gan.AI官网入口网址
实时语音交互的人工智能对话系统。LSLM官网入口网址
智能会议助手,实现会议内容实时转写与总结。
一个简单易用的语音克隆和语音模型训练工具。
一个用于生成对话式语音的模型,支持从文本和音频输入生成高质量的语音。
Spark-TTS 是一种基于大语言模型的高效单流解耦语音合成模型。
工业级可控高效的零样本文本到语音系统
AI驱动的深度W造和语音克隆检测平台,快速验证视频、语音和信息。
基于Kokoro和ONNX运行时的文本到语音(TTS)项目。
Whisper Input 是一个通过按键控制语音录制并快速转译的工具。
Soro是将会议语音自动转文字的AI会议记录助手。
通过语音触发Zapier自动化流程。
个性化AI唤醒服务,助你早起。
基于大型语言模型的语音识别技术。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适