利用AI提升媒体处理和数字资产管理效率
从实体书籍中提取划线或手写标记的文本
AI驱动的先进照片编辑和艺术创作应用,AI Photo Editor & Art Creation官网入口网址
将静态图片转化为生动的动画视频。LivePortrait.app官网入口网址
快速生成带纹理的3D模型,SF3D官网入口网址
UniTok是一个用于视觉生成和理解的统一视觉分词器。
VisionAgent是一个用于生成代码以解决视觉任务的库,支持多种LLM提供商。
一种新颖的图像到视频采样技术,基于Hunyuan模型实现高质量视频生成。
MatAnyone 是一个支持目标指定的稳定视频抠像框架,适用于复杂背景。
一种基于扩散变换器网络的高动态、逼真肖像图像动画技术。
一个基于Google Gemini 2.0的高精度OCR文字识别应用。
基于参考增强扩散的3D内容生成模型
AI绘画软件,与Adobe Photoshop无缝衔接
一个用于创建简单漫画的扩展功能。
将图片轻松转换为3D资产的专业工具
先进的多模态大型语言模型,具备卓越的多模态推理能力。
AIGC学习、创作、分享的平台,旨在引进更多的创意之源,分享更前沿的创意内容,腾讯设计开放平台 – Top.AI官网入口网址
SmolVLM-256M 是世界上最小的多模态模型,可高效处理图像和文本输入并生成文本输出。
新用户免费领1亿tokens,基于领先的千亿级多语言、多模态预训练模型,打造高效率、通用化的“模型即服务”AI开发新范式,智谱API-免费领取官网入口网址
FitDiT 是一种用于高保真虚拟试衣的新型服装感知增强技术。
图像水印技术,可在图片中嵌入局部化水印信息
基于扩散模型的高保真服装重建虚拟试穿技术
智能搜索平台,集成多种AI服务
生成高质量 SVG 代码的基础模型。
一个功能强大的图像生成工具,它通过扩散模型技术,根据文本描述生成高质量的图像。这个工具为用户提供了一种创新的方式来探索和实现他们的创意视觉概念,TextDiffuser-2官网入口网址
开源自回归视觉生成模型项目
革新图像创作,探索无限可能。
先进的多模态大型语言模型
一种基于潜在扩散模型的自监督层次化化妆迁移技术
灵活调整光源位置和强度的AI光照编辑工具
AI漫画翻译神器,享受无语言障碍的漫画阅读体验。
8B参数变分自编码器模型,用于高效的文本到图像生成。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适