最新多模态检查点,提升语音理解能力。Llama3-s v0.2官网入口网址
Sesame AI 是一款先进的语音合成平台,能够生成自然对话式语音并具备情感智能。
LLaSA: 扩展基于 LLaMA 的语音合成的训练时间和测试时间计算量
微软亚洲研究院开发的语音合成技术
TypeScript客户端,用于OpenAI的实时语音API。
实时语音交互的人工智能对话系统。LSLM官网入口网址
让获取知识和听歌一样轻松
基于Kokoro和ONNX运行时的文本到语音(TTS)项目。
高精度视频唇形同步技术
基于OpenAI Whisper的自动语音识别与说话人分割,whisper-diarization官网入口网址
前沿AI研究和产品公司,推动通信未来。Gan.AI官网入口网址
Whisper Input 是一个通过按键控制语音录制并快速转译的工具。
高效、多语种的语音合成模型
用PERSO.ai轻松本地化视频,实现无缝AI配音、声音克隆和口型同步 - 轻松吸引全球观众。
致力于通过自然语音技术,打造个人语音伴侣和全天候可穿戴轻量级眼镜设备。
AI助手,通过语音和动画指导用户,提升网站交互体验。
Sandra AI,专为汽车分销设计的智能语音代理。
个性化语音克隆工具,实现自然语音生成。ChatTTS-OpenVoice官网入口网址
代体是一款 AI 赋能的语音输入法,效率极高。
将您的语音立即转换为文本。完全私密,开源,由AI技术驱动。
将任何PDF文档转换成播客节目。
自动语音识别工具,提供词级时间戳和说话人识别
智能AI游戏伙伴,提供陪伴与娱乐。逗逗游戏伙伴官网入口网址
基于羊驼模型的大型语音生成模型,LlamaVoice官网入口网址
FoloUp 是一个用于招聘的 AI 驱动语音面试平台。
低延迟、高质量的端到端语音交互模型
实时语音和视频AI平台
低延迟的实时语音交互API
自动化电话预约,专为服务提供商打造的AI语音助手。处理日程安排、确认和日历同步,无漏接电话,无麻烦。
首个面向语境智能的人类级实时交互系统,支持多情感、多风格语音交互。
Relyable 让您快速部署高性能 AI 电话代理。
通过语音触发Zapier自动化流程。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适