零样本风格化情侣肖像创作
DeepEP 是一个针对 Mixture-of-Experts 和专家并行通信的高效通信库。
DeepFloyd IF是一个强大的文本到图像生成模型,能够生成高分辨率和逼真度的图像。它结合了先进的语言理解和图像生成技术,提供了多种功能,如超分辨率、风格迁移和零样本学习,DeepFloyd官网入口网址
Tarsier 是由字节跳动推出的用于生成高质量视频描述的大型视频语言模型。
LLaSA: 扩展基于 LLaMA 的语音合成的训练时间和测试时间计算量
31课时掌握神经网络的基本原理和实现方法,以及卷积神经网络、递归神经网络和词向量等经典模型的原理和应用技巧,打下深度学习领域的坚实基础,【新】AI算法工程师-深度学习入门官网入口网址
微软开源的视频分词器家族
轻量级端到端文本到语音模型
图像水印技术,可在图片中嵌入局部化水印信息
此应用可根据文本描述生成图像,或提供现有图像的描述和答案。
实现灵活且高保真度的图像生成,同时保持身份特征。
706课时帮助学生打下坚实的基础,为进一步学习人工智能和深度学习做好准备,AI算法工程师-必备基础与机器学习官网入口网址
革新服装商业摄影的智能编辑工具 图应AI致力于服装行业,专门为商业摄影提供智能化的图片编辑服务,图应AI官网入口网址
Pyramid-Flow的ComfyUI包装节点,用于高效视觉生成。
使用Llama模型的语音合成工具
FLUX.1的最小且通用的控制器
8B参数变分自编码器模型,用于高效的文本到图像生成。
一个社区驱动的深度研究框架,结合语言模型与多种工具。
用于理解任意视频中的相机运动的工具。
强大的语言模型,支持多种自然语言处理任务。
通过测试时间缩放显著提升视频生成质量。
一种非侵入式脑机接口技术,通过脑电图或脑磁图解码大脑活动以实现文本输入。
百度旗下AI算力、学习和实训平台,飞桨AI Studio星河社区官网入口网址
Frames 是 Runway 推出的高级图像生成基础模型,提供前所未有的风格控制和视觉保真度。
OmniThink 是一种通过模拟人类思考过程来提升机器写作知识密度的框架。
一个功能强大的图像生成工具,它通过扩散模型技术,根据文本描述生成高质量的图像。这个工具为用户提供了一种创新的方式来探索和实现他们的创意视觉概念,TextDiffuser-2官网入口网址
InternLM3-8B-Instruct是一个开源的80亿参数指令模型,用于通用用途和高级推理。
开源自回归视觉生成模型项目
音乐生成模型,通过控制网络进行微调。
从零开始学习深度学习,实现GPT模型,zero_to_gpt官网入口网址
开源文本到图像生成模型,AuraFlow v0.3官网入口网址
优秀的图像生成与编辑模型,展示 AI 艺术的新可能。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适