语音处理 - 第 9 页 - Home

语音处理

pdf-to-podcast

将任何PDF文档转换成播客节目。

开源的语音识别和说话人分割模型推理代码

whisper-ner-v1

联合语音转录和实体识别的先进模型

智能AI语音代理，自然对话，多语言支持，用于业务通话自动化。

用PERSO.ai轻松本地化视频，实现无缝AI配音、声音克隆和口型同步 - 轻松吸引全球观众。

Sesame AI 是一款先进的语音合成平台，能够生成自然对话式语音并具备情感智能。

免费在线转换文字为语音

将文本转换为逼真语音的在线工具

轻量级图片数字人驱动算法，快速定制AI伙伴

BetterWhisperX

自动语音识别工具，提供词级时间戳和说话人识别

whisper-diarization

基于OpenAI Whisper的自动语音识别与说话人分割，whisper-diarization官网入口网址

Llama3-s v0.2

最新多模态检查点，提升语音理解能力。Llama3-s v0.2官网入口网址

高精度视频唇形同步技术

智能语音助手，简化日常任务管理。

AI助手，通过语音和动画指导用户，提升网站交互体验。

逗逗游戏伙伴

智能AI游戏伙伴，提供陪伴与娱乐。逗逗游戏伙伴官网入口网址

前沿AI研究和产品公司，推动通信未来。Gan.AI官网入口网址

通过AI语音播报，让您听取您保存的文章。

openai-realtime-api

TypeScript客户端，用于OpenAI的实时语音API。

AI驱动的语音听写工具

基于羊驼模型的大型语音生成模型，LlamaVoice官网入口网址

代体是一款 AI 赋能的语音输入法，效率极高。

FoloUp 是一个用于招聘的 AI 驱动语音面试平台。

LLaSA_training

LLaSA：扩展基于 LLaMA 的语音合成的训练时间和测试时间计算量

实时语音和视频AI平台

CrisperWhisper

精确到词级的自动语音识别模型

Realtime API

低延迟的实时语音交互API

将您的语音立即转换为文本。完全私密，开源，由AI技术驱动。

AI语音助手，提供网站上的实时对话支持和线索转化。

实验室数字化助手，提升科研效率。

低延迟、高质量的端到端语音交互模型

无需对齐信息的零样本文本到语音转换模型

Sandra AI，专为汽车分销设计的智能语音代理。

1…7 8910 11