F Lite 是一款 10B 参数的扩散模型,专注于合法和安全内容。
PhotoDoodle 是一个基于少量样本对数据学习艺术图像编辑的代码实现。
31课时掌握神经网络的基本原理和实现方法,以及卷积神经网络、递归神经网络和词向量等经典模型的原理和应用技巧,打下深度学习领域的坚实基础,【新】AI算法工程师-深度学习入门官网入口网址
VideoLLaMA3是前沿的多模态基础模型,专注于图像和视频理解。
BEN2是一个基于深度学习的图像分割模型,专注于背景擦除和前景提取。
图像水印技术,可在图片中嵌入局部化水印信息
8B参数变分自编码器模型,用于高效的文本到图像生成。
此应用可根据文本描述生成图像,或提供现有图像的描述和答案。
Pusa 是一个新颖的视频扩散模型,支持多种视频生成任务。
Pruna 是一个模型优化框架,帮助开发者快速高效交付模型。
DeepFloyd IF是一个强大的文本到图像生成模型,能够生成高分辨率和逼真度的图像。它结合了先进的语言理解和图像生成技术,提供了多种功能,如超分辨率、风格迁移和零样本学习,DeepFloyd官网入口网址
LLaSA: 扩展基于 LLaMA 的语音合成的训练时间和测试时间计算量
用于识别数学推理过程中的错误
由Novita AI提供的非官方Animate Anyone实现
高容量真实世界图像修复与隐私安全数据管理
视觉语言模型增强工具,结合生成式视觉编码器和深度广度融合技术。
快速生成带纹理的3D模型,SF3D官网入口网址
优秀的图像生成与编辑模型,展示 AI 艺术的新可能。
CogView4-6B 是一个强大的文本到图像生成模型,专注于高质量图像生成。
Huginn-0125是一个35亿参数的潜变量循环深度模型,擅长推理和代码生成。
Tarsier 是由字节跳动推出的用于生成高质量视频描述的大型视频语言模型。
FLUX.1的最小且通用的控制器
一款高效的文本生成图像模型,具有出色的输出质量。
DeepEP 是一个针对 Mixture-of-Experts 和专家并行通信的高效通信库。
AI研究资源导航网站,提供AI研究资源、文档和实践案例
706课时帮助学生打下坚实的基础,为进一步学习人工智能和深度学习做好准备,AI算法工程师-必备基础与机器学习官网入口网址
革新服装商业摄影的智能编辑工具 图应AI致力于服装行业,专门为商业摄影提供智能化的图片编辑服务,图应AI官网入口网址
一款基于Midjourney风格的文本到图像生成模型,专注于高分辨率和写实风格的图像创作。
DreamO 是一个统一的图像定制框架。
高效的视觉编码技术,提升视觉语言模型性能。
轻量级嵌套架构,用于语音反欺诈。
基于 DiT 的人类图像动画框架,实现精细控制与长效一致性。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适