一个基于文本生成图像的预训练模型,具有80亿参数和Apache 2.0开源许可。
由Novita AI提供的非官方Animate Anyone实现
高精度视频唇形同步技术
基于MaskGCT模型的文本到语音演示
基于文本生成服装图像的AI模型
UniTok是一个用于视觉生成和理解的统一视觉分词器。
VideoJAM 是一种用于增强视频生成模型运动连贯性的框架。
31课时掌握神经网络的基本原理和实现方法,以及卷积神经网络、递归神经网络和词向量等经典模型的原理和应用技巧,打下深度学习领域的坚实基础,【新】AI算法工程师-深度学习入门官网入口网址
革新服装商业摄影的智能编辑工具 图应AI致力于服装行业,专门为商业摄影提供智能化的图片编辑服务,图应AI官网入口网址
Janus-Pro-7B 是一个新型的自回归框架,统一多模态理解和生成。
开源项目,用于估算模型训练或推理所需的显存。
Pyramid-Flow的ComfyUI包装节点,用于高效视觉生成。
图像水印技术,可在图片中嵌入局部化水印信息
FLUX.1的最小且通用的控制器
用于视频生成的下一帧预测模型。
在视频扩散变换器中合成任何内容的框架。
一个高效的语音合成模型,支持中英文及语音克隆。
Inductive Moment Matching 是一种新型的生成模型,用于高质量图像生成。
QwQ-32B 是一款强大的推理模型,专为复杂问题解决和文本生成设计,性能卓越。
FlashVideo 是一个高效的高分辨率视频生成模型,专注于细节和保真度的流动。
百度旗下AI算力、学习和实训平台,飞桨AI Studio星河社区官网入口网址
DeepFloyd IF是一个强大的文本到图像生成模型,能够生成高分辨率和逼真度的图像。它结合了先进的语言理解和图像生成技术,提供了多种功能,如超分辨率、风格迁移和零样本学习,DeepFloyd官网入口网址
706课时帮助学生打下坚实的基础,为进一步学习人工智能和深度学习做好准备,AI算法工程师-必备基础与机器学习官网入口网址
Janus-Pro-1B 是一个统一多模态理解和生成的自回归框架。
革命性深度学习工具,用于面部转换和视频生成。
使用文本生成音乐的模型
零样本风格化情侣肖像创作
开源文本到图像生成模型,AuraFlow v0.3官网入口网址
多功能文本到多模态内容生成框架,Alpha-VLLM官网入口网址
一款通过生成模型提升图像生成一致性的工具。
业界首个超大规模混合 Mamba 推理模型,强推理能力。
Pruna 是一个模型优化框架,帮助开发者快速高效交付模型。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适