麦悠电台,用AI技术将新闻转换为对话形式播报,打造个性化电台体验。
视频到音频生成模型,vta-ldm官网入口网址
利用Google Veo3生成高质量视频
智能语音转文字工具,高效且用户友好。
Kimi-Audio 是一个开源音频基础模型,擅长音频理解与生成。
视频分析工具,结合Llama视觉模型和OpenAI Whisper进行本地视频描述生成。
开源的PDF到Podcast工作流构建工具
在线AI配音,将视频和音频本地化为任何语言
快速生成类人语音的TTS模型
从任何音频中提取清晰人声
AI生成播客摘要,不错过任何精彩内容。
利用多指令视频到音频合成技术
将文档转化为AI生成的音频讨论,便于学习和记忆。
高效生成高质量文本到音频模型
AI驱动的播客制作平台,快速生成高质量播客内容。
将静态肖像和输入音频转化为生动的动画对话视频
沉浸式音频导览,让每个地标自己说话
Loopy,仅凭音频驱动肖像头像,实现逼真动态。
快速获取书籍摘要和音频,提升学习效率。
保护隐私的音频深度检测
集成Firecrawl的OpenAI实时API控制台
使用AI技术将WhatsApp音频消息转文字并生成摘要
一个用于说话人分割的工具包
开源的全双工音频生成基础模型
轻松捕捉和完善你的音频创意
基于流匹配的音频驱动说话人像视频生成方法
ComfyUI节点,用于MMAudio模型的音频处理
一个用于将书籍转为有声读物、剧本转为播客的音频生成平台。
ElevenReader Publishing 是一个零成本将书籍快速转化为专业有声书并全球分发的平台。
使用AI技术为孩子们创造个性化的睡前故事。
个性化AI助眠故事生成器,助你安然入梦
将学术论文转化为AI生成的音频讨论。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适