一种从2D图像学习3D人体生成的结构化潜在扩散模型。
一个基于Google Gemini 2.0的高精度OCR文字识别应用。
基于GIMM-VFI的ComfyUI帧插值工具
将图像转换成结构化的Markdown文档
自定义Redux效果强度的图像处理工具
视觉语言模型增强工具,结合生成式视觉编码器和深度广度融合技术。
AI驱动的绘画与照片编辑应用
基于记忆引导扩散的表达性视频生成工具
一种用于控制人类图像动画的方法
一键去除背景,快速创建透明PNG图像
多模态大型模型,处理文本、图像和视频数据
AI赋能的图片设计和文案创作工具,创自由官网入口网址
使用AI技术在任何电商平台虚拟试穿衣物。Visual Try-On Chrome Extension官网入口网址
将静态图片转化为生动的动画视频。LivePortrait.app官网入口网址
多模态自回归模型,擅长文本生成图像,Lumina-mGPT官网入口网址
AI技术实现高质量人脸交换,创造无限可能。
SJinn是一款强大的AI智能代理,用于图像、视频、音频和3D内容创作。
Aladin AI是一款能够在浏览器中运行的AI,为您提供多种工具和功能。
F Lite 是一款 10B 参数的扩散模型,专注于合法和安全内容。
VisionAgent是一个用于生成代码以解决视觉任务的库,支持多种LLM提供商。
用于衡量设备 AI 加速器推理性能的基准测试工具。
Google的AI助手,提升创造力与生产力。
利用AI生成印度风格的图像
通过AI技术将菜单图片转化为单个菜品图片,辅助点餐决策。
一种用于零样本定制图像生成的扩散自蒸馏技术
基于扩散模型的高保真服装重建虚拟试穿技术
基于InternViT-6B-448px-V1-5的增强版视觉模型
一款能够生成电影级质量视频的图像到视频模型
AI驱动的图像到提示生成器,快速将图像转化为创作提示。
1.58-bit量化的先进文本到图像生成模型
Tiamat AI是一个强大的图像创作平台,提供丰富的模板和创作工具.
AnyParser Pro 是一款能够快速准确地从 PDF、PPT 和图像中提取内容的大型语言模型。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适