AnyParser Pro 是一款能够快速准确地从 PDF、PPT 和图像中提取内容的大型语言模型。
将3D模型转换为64x64像素图像,简化3D形状生成。Omages官网入口网址
前沿文本到图像模型,生成逼真图像。Ideogram 2.0官网入口网址
Nano Banana 2连接Gemini 2.5 Flash,支持文本到图像及图像编辑并带水印输出。
Decart Vision平台利用AI实现图像、视频生成与编辑,无需等待创意产出。
使用 ImgEdify 的 AI 驱动工具提升您的图像。
为 Diffusion Transformer 提供高效灵活的控制框架。
WHAM 是微软开发的一种生成式游戏模型,用于生成游戏视觉和控制器动作。
X-Dyna是一种基于扩散模型的零样本人类图像动画生成技术。
基于扩散模型的图像和视频生成工具
基于孪生多模态扩散变换器的创意布局到图像生成技术
AI赋能的图片设计和文案创作工具,创自由官网入口网址
为图片添加可调节放大镜效果的JavaScript库。Magnifier Lens Effect官网入口网址
下一代视频和图像实时对象分割模型。SAM 2官网入口网址
大规模多模态医学数据集,MedTrinity-25M官网入口网址
创建活泼的动漫风格插画,Phantasma Anime官网入口网址
多模态自回归模型,擅长文本生成图像,Lumina-mGPT官网入口网址
BAGEL是一款开源的统一多模态模型,您可以在任何地方进行微调、精简和部署。
实现灵活且高保真度的图像生成,同时保持身份特征。
PaliGemma 2 mix 是一款多功能的视觉语言模型,适用于多种任务和领域。
盲图像恢复技术,利用即时生成参考图像恢复破损图像
利用AI生成印度风格的图像
AI驱动的图片收集和管理工具,提升效率10倍。
使用AI技术在任何电商平台虚拟试穿衣物。Visual Try-On Chrome Extension官网入口网址
将照片转化为非凡肖像的革命性应用,Reimagic.ai官网入口网址
PixNova AI是一款强大的AI图片生成和设计工具,提供多种AI功能,包括人脸交换、图片编辑等。
通过AI创建和共享图像的平台。
全新多模态推理模型,支持图文输入、文字输出,具备高精度图像感知与复杂推理能力。
用于衡量设备 AI 加速器推理性能的基准测试工具。
124B参数的多模态大型语言模型
通过AI技术将菜单图片转化为单个菜品图片,辅助点餐决策。
基于记忆引导扩散的表达性视频生成工具
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适