视频到音频生成模型,vta-ldm官网入口网址
麦悠电台,用AI技术将新闻转换为对话形式播报,打造个性化电台体验。
智能语音转文字工具,高效且用户友好。
将文档转化为AI生成的音频讨论,便于学习和记忆。
Kimi-Audio 是一个开源音频基础模型,擅长音频理解与生成。
AI生成播客摘要,不错过任何精彩内容。
开源的PDF到Podcast工作流构建工具
ComfyUI节点,用于MMAudio模型的音频处理
集成Firecrawl的OpenAI实时API控制台
快速生成类人语音的TTS模型
视频分析工具,结合Llama视觉模型和OpenAI Whisper进行本地视频描述生成。
视频到音频生成模型,增强同步性,MaskVAT官网入口网址
将静态肖像和输入音频转化为生动的动画对话视频
沉浸式音频导览,让每个地标自己说话
个性化AI助眠故事生成器,助你安然入梦
将学术论文转化为AI生成的音频讨论。
Loopy,仅凭音频驱动肖像头像,实现逼真动态。
利用多指令视频到音频合成技术
高效生成高质量文本到音频模型
保护隐私的音频深度检测
使用AI技术将WhatsApp音频消息转文字并生成摘要
AI驱动的播客制作平台,快速生成高质量播客内容。
智能播客生成器,自动创建引人入胜的音频内容。
基于流匹配的音频驱动说话人像视频生成方法
一个开源的GUI音频书和配音生成器。Pandrator官网入口网址
一个用于将书籍转为有声读物、剧本转为播客的音频生成平台。
使用AI技术为孩子们创造个性化的睡前故事。
视频理解领域的先进空间-时间建模与音频理解模型。
从任何音频中提取清晰人声
快速获取书籍摘要和音频,提升学习效率。
零样本声音转换技术,实现音质与音色的高保真转换。
利用OpenAI的Whisper模型转录YouTube视频
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适