Whisper Input 是一个通过按键控制语音录制并快速转译的工具。
LLaSA: 扩展基于 LLaMA 的语音合成的训练时间和测试时间计算量
实验室数字化助手,提升科研效率。
个性化AI唤醒服务,助你早起。
沟通无界,让每次对话都创造价值。
精确到词级的自动语音识别模型
利用AI生成视频脚本、语音和会说话的头像
微软亚洲研究院开发的语音合成技术
情感丰富的多模态语言模型
低延迟的实时语音交互API
使用OpenAI实时API与文档进行语音聊天
使用AI整理和提炼你的想法的语音和文本笔记应用
无需对齐信息的零样本文本到语音转换模型
高效、多语种的语音合成模型
实时浏览器端语音识别应用
AI驱动的语音代理,提供企业级IVR解决方案。Tenyx官网入口网址
一站式生活助手,整合日程、提醒、记事、购物、天气等多功能。Hero App官网入口网址
AI驱动的个人电脑助手,PC Agent官网入口网址
GGAssist提供AI游戏伙伴、AI语音变声等广泛的AI游戏工具。
构建和定制您自己的AI语音助手,连接数百种工具和集成,开始创建您的个性化语音代理。
定制AI语音助手解决方案,为您的日常需求提供智能解决方案。
Spark-TTS 是一种基于大语言模型的高效单流解耦语音合成模型。
Alexa+ 是亚马逊推出的下一代智能语音助手,通过生成式 AI 提供更智能、个性化的服务。
自动化AI语音代理测试与性能分析平台,提供真实场景模拟与评估。
将电子书转换为有声书的工具。
一个具有先进语音活动检测、唤醒词激活和即时转录功能的稳健、高效、低延迟的语音到文本库。
智能卖货主播大模型,提升销售效率,增强购物体验。
AI驱动的语音笔记应用,将语音转换为有组织的摘要和清晰的行动项。
多模态语言模型,融合文本和语音
在Google Docs中添加语音评论
AI助手,通过语音和动画指导用户,提升网站交互体验。
300行代码实现基于LLM的语音转录。WeST官网入口网址
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适