视频到音频生成模型,vta-ldm官网入口网址
麦悠电台,用AI技术将新闻转换为对话形式播报,打造个性化电台体验。
智能语音转文字工具,高效且用户友好。
Kimi-Audio 是一个开源音频基础模型,擅长音频理解与生成。
开源的PDF到Podcast工作流构建工具
利用多指令视频到音频合成技术
将文档转化为AI生成的音频讨论,便于学习和记忆。
AI生成播客摘要,不错过任何精彩内容。
ComfyUI节点,用于MMAudio模型的音频处理
快速生成类人语音的TTS模型
使用AI技术为孩子们创造个性化的睡前故事。
Loopy,仅凭音频驱动肖像头像,实现逼真动态。
高效生成高质量文本到音频模型
集成Firecrawl的OpenAI实时API控制台
在线AI配音,将视频和音频本地化为任何语言
基于流匹配的音频驱动说话人像视频生成方法
视频分析工具,结合Llama视觉模型和OpenAI Whisper进行本地视频描述生成。
视频到音频生成模型,增强同步性,MaskVAT官网入口网址
将静态肖像和输入音频转化为生动的动画对话视频
沉浸式音频导览,让每个地标自己说话
个性化AI助眠故事生成器,助你安然入梦
将学术论文转化为AI生成的音频讨论。
保护隐私的音频深度检测
使用AI技术将WhatsApp音频消息转文字并生成摘要
AI驱动的播客制作平台,快速生成高质量播客内容。
智能播客生成器,自动创建引人入胜的音频内容。
开源的全双工音频生成基础模型
轻松捕捉和完善你的音频创意
一个开源的GUI音频书和配音生成器。Pandrator官网入口网址
一个用于将书籍转为有声读物、剧本转为播客的音频生成平台。
视频理解领域的先进空间-时间建模与音频理解模型。
从任何音频中提取清晰人声
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适