视频到音频生成模型,vta-ldm官网入口网址
麦悠电台,用AI技术将新闻转换为对话形式播报,打造个性化电台体验。
智能语音转文字工具,高效且用户友好。
视频分析工具,结合Llama视觉模型和OpenAI Whisper进行本地视频描述生成。
利用Google Veo3生成高质量视频
开源的PDF到Podcast工作流构建工具
Kimi-Audio 是一个开源音频基础模型,擅长音频理解与生成。
利用多指令视频到音频合成技术
AI生成播客摘要,不错过任何精彩内容。
集成Firecrawl的OpenAI实时API控制台
ComfyUI节点,用于MMAudio模型的音频处理
快速生成类人语音的TTS模型
将静态肖像和输入音频转化为生动的动画对话视频
Loopy,仅凭音频驱动肖像头像,实现逼真动态。
将文档转化为AI生成的音频讨论,便于学习和记忆。
高效生成高质量文本到音频模型
保护隐私的音频深度检测
AI驱动的播客制作平台,快速生成高质量播客内容。
在线AI配音,将视频和音频本地化为任何语言
轻松捕捉和完善你的音频创意
基于流匹配的音频驱动说话人像视频生成方法
使用AI技术为孩子们创造个性化的睡前故事。
沉浸式音频导览,让每个地标自己说话
个性化AI助眠故事生成器,助你安然入梦
将学术论文转化为AI生成的音频讨论。
使用AI技术将WhatsApp音频消息转文字并生成摘要
一个用于说话人分割的工具包
开源的全双工音频生成基础模型
一个开源的GUI音频书和配音生成器。Pandrator官网入口网址
视频到音频生成模型,增强同步性,MaskVAT官网入口网址
一个用于将书籍转为有声读物、剧本转为播客的音频生成平台。
视频理解领域的先进空间-时间建模与音频理解模型。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适