一键将视频转换为优质小红书笔记
大型多模态模型中视频理解的探索
一种基于视频扩散模型的多任务灵巧手操控通用机器人策略
将文本转换为逼真语音的在线工具
沟通无界,让每次对话都创造价值。
微软亚洲研究院开发的语音合成技术
将任何PDF文档转换成播客节目。
使用Llama模型的语音合成工具
将任何PDF转换为播客集!
基于深度学习的高质量文本到语音合成模型
多模态语言模型,融合文本和语音
Sandra AI,专为汽车分销设计的智能语音代理。
高效、多语种的语音合成模型
将学术论文转化为AI生成的音频讨论。
为无声视频生成逼真且同步的声音。
端到端音频驱动的人体动画框架
Loopy,仅凭音频驱动肖像头像,实现逼真动态。
利用多指令视频到音频合成技术
利用OpenAI的Whisper模型转录YouTube视频
开源的全双工音频生成基础模型
基于流匹配的音频驱动说话人像视频生成方法
MMAudio根据视频和/或文本输入生成同步音频。
Amped Studio - 在线制作音乐
使用AI生成音乐的应用
在本地使用 LLMs 根据自然语言提示生成音乐。
音乐情绪匹配大师
利用AI技术,轻松制作高质量歌曲翻唱。
利用AI创作音乐
统一文本、音乐和动作生成模型
音乐创作与分享平台
自动化研究与开发工具,提升研发效率与质量。
全栈开源机器人
总奖金超 233 万!
报名即将截止