开源的全双工音频生成基础模型
一个开源的GUI音频书和配音生成器。Pandrator官网入口网址
视频到音频生成模型,增强同步性,MaskVAT官网入口网址
视频理解领域的先进空间-时间建模与音频理解模型。
利用OpenAI的Whisper模型转录YouTube视频
智能播客生成器,自动创建引人入胜的音频内容。
快速生成个性化和富有表现力的3D会说话面部模型
基于扩散模型的音频驱动人像和动物图像动画技术
MMAudio根据视频和/或文本输入生成同步音频。
Reddit故事的有声化平台
轻量级嵌套架构,用于语音反欺诈。
ElevenReader Publishing 是一个零成本将书籍快速转化为专业有声书并全球分发的平台。
为无声视频生成逼真且同步的声音。
将PDF文件转换为音频播客、讲座、摘要等
一个全面的AI神经网络工具目录
下一代语音AI,提供卓越的音频数据处理能力。
EchoMimicV2:实现逼真、简化、半身人体动画的技术。
本地部署的AI语音工具箱,支持语音识别、转录和转换。Easy Voice Toolkit官网入口网址
V03 AI是基于Google Veo 3 AI技术的视频生成器,支持文本到视频和图片到视频的转换,具备音频功能。
JoyGen 是一种音频驱动的 3D 深度感知的说话人脸视频编辑技术。
AI生成语音音频的本地化水印技术
端到端音频驱动的人体动画框架
播客分享平台,发现热门播客节目。
Veo 3是一款具有同步音频功能的AI视频生成工具。
全球音频感知技术的革命性AI唇同步技术。
通过音频扩散模型实现源分离和合成的创新方法。
AI视频生成器,将文本转换成引人注目的视频。
使用Veo 3创建令人惊叹的AI视频,并同步添加音频。
Veo 3 AI API by Kie.ai是一款可生成高质量视频的先进工具,适用于电影制作人、营销人员和内容创作者。
一个用于生成播客及其他音频文件转录文本的工具,支持多种语言模型和语音识别API。
Maidio 是一款将 RSS 新闻内容通过 AI 转化为对话式播客的智能应用。
AI ASMR Generator是一个使用AI模型生成ASMR视频的工具。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适