与大型语言模型进行自然的语音对话
一款文本转语音工具,帮助您轻松阅读文本。
功能强大的语音离线文件转写服务
高精度视频唇形同步技术
无需对齐信息的零样本文本到语音转换模型
统一的开放命名实体和语音识别模型
联合语音转录和实体识别的先进模型
基于OpenAI Whisper的自动语音识别与说话人分割,whisper-diarization官网入口网址
前沿AI研究和产品公司,推动通信未来。Gan.AI官网入口网址
一站式生活助手,整合日程、提醒、记事、购物、天气等多功能。Hero App官网入口网址
实时语音交互的人工智能对话系统。LSLM官网入口网址
智能会议助手,实现会议内容实时转写与总结。
一个简单易用的语音克隆和语音模型训练工具。
Spark-TTS 是一种基于大语言模型的高效单流解耦语音合成模型。
Alexa+ 是亚马逊推出的下一代智能语音助手,通过生成式 AI 提供更智能、个性化的服务。
工业级可控高效的零样本文本到语音系统
一个提供语音克隆和AI语音内容创作的平台。
AI驱动的深度W造和语音克隆检测平台,快速验证视频、语音和信息。
基于Kokoro和ONNX运行时的文本到语音(TTS)项目。
Whisper Input 是一个通过按键控制语音录制并快速转译的工具。
Soro是将会议语音自动转文字的AI会议记录助手。
MiniCPM-o 2.6是一个强大的多模态大型语言模型,适用于视觉、语音和多模态直播。
实验室数字化助手,提升科研效率。
基于大型语言模型的语音识别技术。
轻量级端到端文本到语音模型
低延迟、高质量的端到端语音交互模型
将任何PDF文档转换成播客节目。
低延迟的实时语音交互API
开源的语音识别和说话人分割模型推理代码
使用OpenAI实时API与文档进行语音聊天
使用AI整理和提炼你的想法的语音和文本笔记应用
AI驱动的语音笔记应用,将语音转换为有组织的摘要和清晰的行动项。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适