一种通过视觉上下文学习的通用图像生成框架。
QwQ-32B 是一款强大的推理模型,专为复杂问题解决和文本生成设计,性能卓越。
UniTok是一个用于视觉生成和理解的统一视觉分词器。
FlashVideo 是一个高效的高分辨率视频生成模型,专注于细节和保真度的流动。
百度旗下AI算力、学习和实训平台,飞桨AI Studio星河社区官网入口网址
VideoJAM 是一种用于增强视频生成模型运动连贯性的框架。
706课时帮助学生打下坚实的基础,为进一步学习人工智能和深度学习做好准备,AI算法工程师-必备基础与机器学习官网入口网址
Janus-Pro-1B 是一个统一多模态理解和生成的自回归框架。
MatAnyone 是一个支持目标指定的稳定视频抠像框架,适用于复杂背景。
革新服装商业摄影的智能编辑工具 图应AI致力于服装行业,专门为商业摄影提供智能化的图片编辑服务,图应AI官网入口网址
开源项目,用于估算模型训练或推理所需的显存。
Pyramid-Flow的ComfyUI包装节点,用于高效视觉生成。
图像水印技术,可在图片中嵌入局部化水印信息
FLUX.1的最小且通用的控制器
开源文本到图像生成模型,AuraFlow v0.3官网入口网址
多功能文本到多模态内容生成框架,Alpha-VLLM官网入口网址
用于视频生成的下一帧预测模型。
一款通过生成模型提升图像生成一致性的工具。
在视频扩散变换器中合成任何内容的框架。
一个高效的语音合成模型,支持中英文及语音克隆。
业界首个超大规模混合 Mamba 推理模型,强推理能力。
Pruna 是一个模型优化框架,帮助开发者快速高效交付模型。
Inductive Moment Matching 是一种新型的生成模型,用于高质量图像生成。
DeepFloyd IF是一个强大的文本到图像生成模型,能够生成高分辨率和逼真度的图像。它结合了先进的语言理解和图像生成技术,提供了多种功能,如超分辨率、风格迁移和零样本学习,DeepFloyd官网入口网址
行业领先的人工智能基础架构解决方案商,思腾合力官网入口网址
YuE是一个开源的音乐生成模型,能够将歌词转化为完整的歌曲。
31课时掌握神经网络的基本原理和实现方法,以及卷积神经网络、递归神经网络和词向量等经典模型的原理和应用技巧,打下深度学习领域的坚实基础,【新】AI算法工程师-深度学习入门官网入口网址
一个基于文本生成图像的预训练模型,具有80亿参数和Apache 2.0开源许可。
生数以其创新的多模态大模型和深度生成式算法研究,为艺术设计、游戏制作、影视后期和内容社交等领域提供了强大的技术支持和解决方案,生数官网入口网址
Janus-Pro-7B 是一个新型的自回归框架,统一多模态理解和生成。
一个功能强大的图像生成工具,它通过扩散模型技术,根据文本描述生成高质量的图像。这个工具为用户提供了一种创新的方式来探索和实现他们的创意视觉概念,TextDiffuser-2官网入口网址
革命性深度学习工具,用于面部转换和视频生成。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适