图像生成

HiPixel

HiPixel 是一款用于 AI 驱动的图像超分辨处理的 macOS 桌面客户端应用。

SigLIP2

SigLIP2 是谷歌推出的一种多语言视觉语言编码器，用于零样本图像分类。

Electronic-Component-Sorter

AI驱动的电子元件分类器，智能组件管理的终极解决方案。

In-Context LoRA for Diffusion Transformers

一种用于扩散变换器的上下文LoRA微调技术

TryOffDiff

基于扩散模型的高保真服装重建虚拟试穿技术

ColorFlow

图像序列着色模型，保留细粒度身份信息

PNGFree.ai

提供免费PNG图片下载和AI图片处理工具

AI Photo Editor & Art Creation

AI驱动的先进照片编辑和艺术创作应用，AI Photo Editor & Art Creation官网入口网址

Seedream 4.0

使用Seedream 4.0创建惊艳的AI艺术。

MIDI

通过多实例扩散模型将单张图像生成高保真度的3D场景。

Aya Vision 32B

Aya Vision 32B 是一个支持多语言的视觉语言模型，适用于OCR、图像描述、视觉推理等多种用途。

Janus-Pro-1B

Janus-Pro-1B 是一个统一多模态理解和生成的自回归框架。

EdgeOne Pages Functions AI OCR

AI驱动的图像文字识别服务

F Lite

F Lite 是一款 10B 参数的扩散模型，专注于合法和安全内容。

InternVL3

InternVL3开源：7种尺寸覆盖文、图、视频处理，多模态能力扩展至工业图像分析

StructLDM

一种从2D图像学习3D人体生成的结构化潜在扩散模型。

Google Gemini App

Google的AI助手，提升创造力与生产力。

InternVL2_5-4B-MPO

多模态大型语言模型，展示卓越的整体性能

GLM-4-Plus

国际领先的语言理解与长文本处理大模型。GLM-4-Plus官网入口网址

CrossPrism for MacOS

图像识别、标注和关键词生成工具，CrossPrism for MacOS官网入口网址

wink

AI 视频编辑工具，智能修复视频和图片画质。

DreamO

DreamO 是一个统一的图像定制框架。

Claude Vision Object Detection

利用Claude 3.5 Sonnet Vision API进行图像中物体检测和可视化的强大Python工具

SHMT

一种基于潜在扩散模型的自监督层次化化妆迁移技术

LivePortrait.app

将静态图片转化为生动的动画视频。LivePortrait.app官网入口网址

SF3D

快速生成带纹理的3D模型，SF3D官网入口网址

AI Ease Video Watermark Remover

AI Ease 视频水印移除工具，可帮助用户轻松去除视频中的水印。

魔法AI绘画

基于 Next.js 的多模型 AI 绘画应用，支持文生图和图生图功能。

VisionAgent

VisionAgent是一个用于生成代码以解决视觉任务的库，支持多种LLM提供商。

ai-toolkit

AI脚本集合，主要用于Stable Diffusion模型。ai-toolkit官网入口网址

Fai-Fuzer

AI技术赋能的图像编辑工具，Fai-Fuzer官网入口网址

千象Pixeling

提供多种AI图像和视频创作功能的平台，千象Pixeling官网入口网址

OpeniTab