快速生成带纹理的3D模型,SF3D官网入口网址
一种通过视觉上下文学习的通用图像生成框架。
一个基于文本生成图像的预训练模型,具有80亿参数和Apache 2.0开源许可。
Janus-Pro-7B 是一个新型的自回归框架,统一多模态理解和生成。
开源项目,用于估算模型训练或推理所需的显存。
由Novita AI提供的非官方Animate Anyone实现
基于深度学习的高质量文本到语音合成模型
从单张图片创建全身动态说话头像
基于文本生成服装图像的AI模型
QwQ-32B 是一款强大的推理模型,专为复杂问题解决和文本生成设计,性能卓越。
UniTok是一个用于视觉生成和理解的统一视觉分词器。
VideoJAM 是一种用于增强视频生成模型运动连贯性的框架。
31课时掌握神经网络的基本原理和实现方法,以及卷积神经网络、递归神经网络和词向量等经典模型的原理和应用技巧,打下深度学习领域的坚实基础,【新】AI算法工程师-深度学习入门官网入口网址
革新服装商业摄影的智能编辑工具 图应AI致力于服装行业,专门为商业摄影提供智能化的图片编辑服务,图应AI官网入口网址
Pyramid-Flow的ComfyUI包装节点,用于高效视觉生成。
图像水印技术,可在图片中嵌入局部化水印信息
FLUX.1的最小且通用的控制器
零样本风格化情侣肖像创作
用于视频生成的下一帧预测模型。
在视频扩散变换器中合成任何内容的框架。
一个高效的语音合成模型,支持中英文及语音克隆。
Inductive Moment Matching 是一种新型的生成模型,用于高质量图像生成。
FlashVideo 是一个高效的高分辨率视频生成模型,专注于细节和保真度的流动。
一种非侵入式脑机接口技术,通过脑电图或脑磁图解码大脑活动以实现文本输入。
百度旗下AI算力、学习和实训平台,飞桨AI Studio星河社区官网入口网址
DeepFloyd IF是一个强大的文本到图像生成模型,能够生成高分辨率和逼真度的图像。它结合了先进的语言理解和图像生成技术,提供了多种功能,如超分辨率、风格迁移和零样本学习,DeepFloyd官网入口网址
YuE是一个开源的音乐生成模型,能够将歌词转化为完整的歌曲。
706课时帮助学生打下坚实的基础,为进一步学习人工智能和深度学习做好准备,AI算法工程师-必备基础与机器学习官网入口网址
Janus-Pro-1B 是一个统一多模态理解和生成的自回归框架。
革命性深度学习工具,用于面部转换和视频生成。
使用文本生成音乐的模型
开源的音乐生成模型
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适