通过测试时间缩放显著提升视频生成质量。
百度旗下AI算力、学习和实训平台,飞桨AI Studio星河社区官网入口网址
OmniThink 是一种通过模拟人类思考过程来提升机器写作知识密度的框架。
一个功能强大的图像生成工具,它通过扩散模型技术,根据文本描述生成高质量的图像。这个工具为用户提供了一种创新的方式来探索和实现他们的创意视觉概念,TextDiffuser-2官网入口网址
InternLM3-8B-Instruct是一个开源的80亿参数指令模型,用于通用用途和高级推理。
Pyramid-Flow的ComfyUI包装节点,用于高效视觉生成。
高质量身份保留的人像动画合成工具。
使用Llama模型的语音合成工具
音乐生成模型,通过控制网络进行微调。
轻松在远程GPU上运行本地笔记本,Moonglow官网入口网址
从零开始学习深度学习,实现GPT模型,zero_to_gpt官网入口网址
开源文本到图像生成模型,AuraFlow v0.3官网入口网址
上下文驱动的图像生成工具,保持前景保真度。
BAGEL是一款开源的统一多模态模型,您可以在任何地方进行微调、精简和部署。
一种高效的无泄漏唇同步技术。
一种无混叠的任意尺度超分辨率方法。
Lumina-Video 是一个用于视频生成的初步尝试项目,支持文本到视频的生成。
行业领先的人工智能基础架构解决方案商,思腾合力官网入口网址
一个强大的代码生成和理解工具,它通过大规模训练和多样化的模型规模,为开发者提供了一个高性能的编程辅助平台,StarCoder 2官网入口网址
利用AI创作音乐
提升户外虚拟试穿效果的模型训练代码库
一个基于深度学习的图像和视频描述模型。
强大的语言模型,支持多种自然语言处理任务。
一款先进的视觉推理模型,能分析图片和视频内容。
一款用于生成信息图表的视觉文本渲染工具。
业界首个超大规模混合 Mamba 推理模型,强推理能力。
实现灵活且高保真度的图像生成,同时保持身份特征。
通过多实例扩散模型将单张图像生成高保真度的3D场景。
一种非侵入式脑机接口技术,通过脑电图或脑磁图解码大脑活动以实现文本输入。
基于自回归变换器生成人工制作的 3D 原始装配体。
为 Diffusion Transformer 提供高效灵活的控制框架。
深度推理翻译模型,通过长思考链优化神经机器翻译。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适