利用AI提升媒体处理和数字资产管理效率
多模态12B参数模型,结合视觉编码器处理图像和文本。
MatAnyone 是一个支持目标指定的稳定视频抠像框架,适用于复杂背景。
InternVL3开源:7种尺寸覆盖文、图、视频处理,多模态能力扩展至工业图像分析
UniTok是一个用于视觉生成和理解的统一视觉分词器。
AIGC学习、创作、分享的平台,旨在引进更多的创意之源,分享更前沿的创意内容,腾讯设计开放平台 – Top.AI官网入口网址
一种基于扩散变换器网络的高动态、逼真肖像图像动画技术。
FitDiT 是一种用于高保真虚拟试衣的新型服装感知增强技术。
简便易用、功能强大的免费修图软件
AI绘画软件,与Adobe Photoshop无缝衔接
提供免费PNG图片下载和AI图片处理工具
AI驱动的图像文字识别服务
快速生成带纹理的3D模型,SF3D官网入口网址
HiPixel 是一款用于 AI 驱动的图像超分辨处理的 macOS 桌面客户端应用。
SmolVLM-256M 是世界上最小的多模态模型,可高效处理图像和文本输入并生成文本输出。
一种从2D图像学习3D人体生成的结构化潜在扩散模型。
为ComfyUI提供Luma AI API的自定义节点。
基于参考增强扩散的3D内容生成模型
自定义Redux效果强度的图像处理工具
多模态大型模型,处理文本、图像和视频数据
先进的多模态大型语言模型,具备卓越的多模态推理能力。
VisionAgent是一个用于生成代码以解决视觉任务的库,支持多种LLM提供商。
Animate Anyone 2 是一款高保真角色图像动画生成工具,支持环境适配。
Genime AI 是一款专注于动画生成与编辑的工具,提供图像到 3D、补间动画等功能。
一个基于Google Gemini 2.0的高精度OCR文字识别应用。
基于GIMM-VFI的ComfyUI帧插值工具
图像水印技术,可在图片中嵌入局部化水印信息
从实体书籍中提取划线或手写标记的文本
将静态图片转化为生动的动画视频。LivePortrait.app官网入口网址
新用户免费领1亿tokens,基于领先的千亿级多语言、多模态预训练模型,打造高效率、通用化的“模型即服务”AI开发新范式,智谱API-免费领取官网入口网址
视频扩散模型,用于虚拟试穿。
8B参数变分自编码器模型,用于高效的文本到图像生成。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适