多模态自回归模型,擅长文本生成图像,Lumina-mGPT官网入口网址
ViPer是一种个性化方法,通过要求用户对几张图片发表评论,解释他们的喜好和不喜好,提取个人偏好。这些偏好指导文本到图像模型生成符合个人口味的图像。ViPer官网入口网址
将照片转化为非凡肖像的革命性应用,Reimagic.ai官网入口网址
生成高质量 SVG 代码的基础模型。
1.3B参数的图像转视频模型,用于生成3D一致的新场景视图
一种无混叠的任意尺度超分辨率方法。
通过多实例扩散模型将单张图像生成高保真度的3D场景。
Inductive Moment Matching 是一种新型的生成模型,用于高质量图像生成。
HunyuanVideo-I2V 是腾讯推出的基于 HunyuanVideo 的图像到视频生成框架。
使用先进 AI 技术快速去除图片背景,无需手动编辑,提升工作效率。
无需额外训练的高质量图像修复插件,适用于所有稳定扩散模型。
Aya Vision 32B 是一个支持多语言的视觉语言模型,适用于OCR、图像描述、视觉推理等多种用途。
由 Google 训练的 AI 模型,用于对野生动物相机陷阱图像中的物种进行分类。
Adobe 推出全新 Photoshop iPhone 应用,为移动创作者重新定义图像编辑体验。
VLM-R1 是一个稳定且通用的强化视觉语言模型,专注于视觉理解任务。
Light-A-Video 是一种无需训练的视频重光照技术,通过渐进式光照融合实现平滑的视频重光照效果。
Animate Anyone 2 是一款高保真角色图像动画生成工具,支持环境适配。
基于推理驱动的目标检测技术,通过文本提示实现类似人类精度的检测。
X-Dyna是一种基于扩散模型的零样本人类图像动画生成技术。
LLMs 无需任何培训就能看见和听见
基于GIMM-VFI的ComfyUI帧插值工具
基于InternViT-300M-448px的增强版本,提升视觉特征提取能力。
创建可动的4D人像化身模型
AI脚本集合,主要用于Stable Diffusion模型。ai-toolkit官网入口网址
利用Flux进行图像细节增强的实验性工具,Flux Latent Detailer官网入口网址
3D纹理生成技术,根据文本描述合成3D纹理,TexGen官网入口网址
3D高斯生成技术,实现任意未摆姿势图像的3D重建
即时生成无版权图片
无需调优的全景多视图图像生成,PanoFree官网入口网址
AI图像生成API,提供高质量的4K图像生成和编辑功能。Picogen AI Image API官网入口网址
Qwen2.5-Omni 是阿里云通义千问团队开发的端到端多模态模型,支持文本、音频、图像、视频输入。
LLaVA-Mini是可高效理解图像、视频的大型多模态模型。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适