多语种语音理解模型,提供高精度语音识别与情感识别。SenseVoice官网入口网址
Hibiki 是一款用于流式语音翻译(即同声传译)的模型,能够实时逐块生成正确翻译。
快速生成类人语音的TTS模型
全本地AI语音聊天工具,低延迟,高效率。voicechat2官网入口网址
Gemini 2.0 是谷歌推出的最新一代生成式 AI 模型,包含 Flash、Flash-Lite 和 Pro 版本。
低延迟、高质量的端到端语音交互模型
低延迟的实时语音交互API
可扩展的流媒体语音合成技术,结合大型语言模型。
首个面向语境智能的人类级实时交互系统,支持多情感、多风格语音交互。
实时语音交互数字人,支持端到端语音方案
数字孪生视频对话平台,Tavus CVI官网入口网址
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适