MatAnyone 是一个支持目标指定的稳定视频抠像框架,适用于复杂背景。
BEN2是一个基于深度学习的图像分割模型,专注于背景擦除和前景提取。
Frames 是 Runway 推出的高级图像生成基础模型,提供前所未有的风格控制和视觉保真度。
一个基于文本生成图像的预训练模型,具有80亿参数和Apache 2.0开源许可。
革新服装商业摄影的智能编辑工具 图应AI致力于服装行业,专门为商业摄影提供智能化的图片编辑服务,图应AI官网入口网址
生数以其创新的多模态大模型和深度生成式算法研究,为艺术设计、游戏制作、影视后期和内容社交等领域提供了强大的技术支持和解决方案,生数官网入口网址
一款基于Midjourney风格的文本到图像生成模型,专注于高分辨率和写实风格的图像创作。
FaceSwap是一个功能强大且用户友好的在线换脸工具,利用AI技术提供快速、高质量的换脸效果。无论是个人娱乐还是专业项目,FaceSwap都能满足用户的需求,FaceSwap AI官网入口网址
一个功能强大的图像生成工具,它通过扩散模型技术,根据文本描述生成高质量的图像。这个工具为用户提供了一种创新的方式来探索和实现他们的创意视觉概念,TextDiffuser-2官网入口网址
展示小型语言模型通过自我演化深度思考掌握数学推理能力的研究成果。
InternLM3-8B-Instruct是一个开源的80亿参数指令模型,用于通用用途和高级推理。
用于识别数学推理过程中的错误
通过多样化合成数据和全局到局部自适应感知增强文档布局分析
开源自回归视觉生成模型项目
革命性深度学习工具,用于面部转换和视频生成。
高质量身份保留的人像动画合成工具。
快速因果视频生成器,实现即时视频生成。
微软开源的视频分词器家族
轻量级端到端文本到语音模型
基于MaskGCT模型的文本到语音演示
统一的开放命名实体和语音识别模型
音乐生成模型,通过控制网络进行微调。
使用文本生成音乐的模型
利用AI创作音乐
高容量真实世界图像修复与隐私安全数据管理
FLUX.1的最小且通用的控制器
视觉语言模型增强工具,结合生成式视觉编码器和深度广度融合技术。
零样本风格化情侣肖像创作
深度推理翻译模型,通过长思考链优化神经机器翻译。
70B参数的文本生成模型
HunyuanVideo-I2V 是腾讯推出的基于 HunyuanVideo 的图像到视频生成框架。
QwQ-32B 是一款强大的推理模型,专为复杂问题解决和文本生成设计,性能卓越。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适