面向未来的操作系统,以行动为中心而非应用
腾讯开源的大型视频生成模型训练框架
快速因果视频生成器,实现即时视频生成。
一种基于视频扩散模型的多任务灵巧手操控通用机器人策略
将任何PDF文档转换成播客节目。
利用多指令视频到音频合成技术
使用AI生成音乐的应用
下一代视频和图像实时对象分割模型。SAM 2官网入口网址
产品团队的人工智能副驾驶员,Lancey官网入口网址
文思逸言 WiseTalker是一款集成多种服务的人工智能软件,支持对话和代码编写,内置多种AI工具,助力工作和学习,文思逸言官网入口网址
GPT 5是下一代AI模型,提供卓越的编码、数学和推理性能。
专为虚构写作设计的人工智能模型,帮助作者创作高质量的小说内容。
NotaGen 是一个用于符号音乐生成的模型,采用大语言模型训练范式,专注于生成高质量古典乐谱。
UniTok是一个用于视觉生成和理解的统一视觉分词器。
Phind是一款先进的人工智能搜索工具,支持多语言和多搜索功能。
Qwen Chat 是一个基于先进语言模型的人工智能聊天工具,提供智能对话和多种功能。
VideoWorld是一个探索从无标签视频中学习知识的深度生成模型。
Sonify 在音频、数据和新兴技术的交叉领域进行创新。我们设计和开发音频优先的产品和数据驱动的解决方案,SONIFY.io官网入口网址
智能AI文章批量生成器 – 人工智能AI一键快速批量生成高质量文章,水母快写官网入口网址
WebWalker是一个用于评估大型语言模型在网页遍历能力上的基准测试框架。
GameFactory 是一个基于预训练视频扩散模型的通用世界模型,可创建开放领域的游戏。
一个基于DeepSeek API的Manim动画生成工具,用于快速创建数学和科学动画。
JetBrains推出的编程辅助工具,帮助开发者更高效地完成代码任务。
LLMs 无需任何培训就能看见和听见
Llasa-1B 是一个基于 LLaMA 的文本转语音 (TTS) 模型,支持中英文语音合成。
强大的AI工具,它通过简化广告创意和社交媒体帖子的生成过程,帮助用户节省时间和资源,Predis.ai官网入口网址
FitDiT 是一种用于高保真虚拟试衣的新型服装感知增强技术。
业界领先的开源大型混合专家模型
长视频语言理解的时空自适应压缩模型
视频生成模型Sora的存档库
基于深度学习的高质量文本到语音合成模型
利用OpenAI的Whisper模型转录YouTube视频
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适