一款高效的文本生成图像模型,具有出色的输出质量。
DreamO 是一个统一的图像定制框架。
F Lite 是一款 10B 参数的扩散模型,专注于合法和安全内容。
Pusa 是一个新颖的视频扩散模型,支持多种视频生成任务。
基于 DiT 的人类图像动画框架,实现精细控制与长效一致性。
一款用于生成信息图表的视觉文本渲染工具。
业界首个超大规模混合 Mamba 推理模型,强推理能力。
一种无混叠的任意尺度超分辨率方法。
CogView4-6B 是一个强大的文本到图像生成模型,专注于高质量图像生成。
PhotoDoodle 是一个基于少量样本对数据学习艺术图像编辑的代码实现。
Lumina-Video 是一个用于视频生成的初步尝试项目,支持文本到视频的生成。
AI研究资源导航网站,提供AI研究资源、文档和实践案例
行业领先的人工智能基础架构解决方案商,思腾合力官网入口网址
一款基于Midjourney风格的文本到图像生成模型,专注于高分辨率和写实风格的图像创作。
高质量身份保留的人像动画合成工具。
利用AI创作音乐
高容量真实世界图像修复与隐私安全数据管理
提升户外虚拟试穿效果的模型训练代码库
轻松在远程GPU上运行本地笔记本,Moonglow官网入口网址
基于自回归变换器生成人工制作的 3D 原始装配体。
高效的视觉编码技术,提升视觉语言模型性能。
轻量级嵌套架构,用于语音反欺诈。
Huginn-0125是一个35亿参数的潜变量循环深度模型,擅长推理和代码生成。
深度推理翻译模型,通过长思考链优化神经机器翻译。
一个基于深度学习的图像和视频描述模型。
一款先进的视觉推理模型,能分析图片和视频内容。
通过多实例扩散模型将单张图像生成高保真度的3D场景。
一个强大的代码生成和理解工具,它通过大规模训练和多样化的模型规模,为开发者提供了一个高性能的编程辅助平台,StarCoder 2官网入口网址
上下文驱动的图像生成工具,保持前景保真度。
BAGEL是一款开源的统一多模态模型,您可以在任何地方进行微调、精简和部署。
一种高效的无泄漏唇同步技术。
为 Diffusion Transformer 提供高效灵活的控制框架。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适