开源的语音识别和说话人分割模型推理代码
联合语音转录和实体识别的先进模型
智能AI语音代理,自然对话,多语言支持,用于业务通话自动化。
Sesame AI 是一款先进的语音合成平台,能够生成自然对话式语音并具备情感智能。
将文本转换为逼真语音的在线工具
将任何PDF文档转换成播客节目。
自动语音识别工具,提供词级时间戳和说话人识别
基于OpenAI Whisper的自动语音识别与说话人分割,whisper-diarization官网入口网址
最新多模态检查点,提升语音理解能力。Llama3-s v0.2官网入口网址
用PERSO.ai轻松本地化视频,实现无缝AI配音、声音克隆和口型同步 - 轻松吸引全球观众。
高精度视频唇形同步技术
AI助手,通过语音和动画指导用户,提升网站交互体验。
智能AI游戏伙伴,提供陪伴与娱乐。逗逗游戏伙伴官网入口网址
前沿AI研究和产品公司,推动通信未来。Gan.AI官网入口网址
通过AI语音播报,让您听取您保存的文章。
TypeScript客户端,用于OpenAI的实时语音API。
AI驱动的语音听写工具
基于羊驼模型的大型语音生成模型,LlamaVoice官网入口网址
FoloUp 是一个用于招聘的 AI 驱动语音面试平台。
LLaSA: 扩展基于 LLaMA 的语音合成的训练时间和测试时间计算量
智能语音助手,简化日常任务管理。
精确到词级的自动语音识别模型
实时语音和视频AI平台
低延迟的实时语音交互API
轻量级图片数字人驱动算法,快速定制AI伙伴
代体是一款 AI 赋能的语音输入法,效率极高。
将您的语音立即转换为文本。完全私密,开源,由AI技术驱动。
AI语音助手,提供网站上的实时对话支持和线索转化。
无需对齐信息的零样本文本到语音转换模型
Sandra AI,专为汽车分销设计的智能语音代理。
高效、多语种的语音合成模型
开源、注重隐私的语音助手
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适