视频到音频生成模型,vta-ldm官网入口网址
麦悠电台,用AI技术将新闻转换为对话形式播报,打造个性化电台体验。
智能语音转文字工具,高效且用户友好。
开源的PDF到Podcast工作流构建工具
将文档转化为AI生成的音频讨论,便于学习和记忆。
高效生成高质量文本到音频模型
智能播客生成器,自动创建引人入胜的音频内容。
ComfyUI节点,用于MMAudio模型的音频处理
个性化AI助眠故事生成器,助你安然入梦
AI生成播客摘要,不错过任何精彩内容。
保护隐私的音频深度检测
使用AI技术将WhatsApp音频消息转文字并生成摘要
AI驱动的播客制作平台,快速生成高质量播客内容。
轻松捕捉和完善你的音频创意
基于扩散模型的音频驱动人像和动物图像动画技术
基于流匹配的音频驱动说话人像视频生成方法
快速生成类人语音的TTS模型
视频分析工具,结合Llama视觉模型和OpenAI Whisper进行本地视频描述生成。
一个开源的GUI音频书和配音生成器。Pandrator官网入口网址
视频到音频生成模型,增强同步性,MaskVAT官网入口网址
一个用于将书籍转为有声读物、剧本转为播客的音频生成平台。
ElevenReader Publishing 是一个零成本将书籍快速转化为专业有声书并全球分发的平台。
JoyGen 是一种音频驱动的 3D 深度感知的说话人脸视频编辑技术。
使用AI技术为孩子们创造个性化的睡前故事。
将静态肖像和输入音频转化为生动的动画对话视频
沉浸式音频导览,让每个地标自己说话
将学术论文转化为AI生成的音频讨论。
视频理解领域的先进空间-时间建模与音频理解模型。
为无声视频生成逼真且同步的声音。
从任何音频中提取清晰人声
端到端音频驱动的人体动画框架
Loopy,仅凭音频驱动肖像头像,实现逼真动态。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适