百度旗下AI算力、学习和实训平台,飞桨AI Studio星河社区官网入口网址
行业领先的人工智能基础架构解决方案商,思腾合力官网入口网址
31课时掌握神经网络的基本原理和实现方法,以及卷积神经网络、递归神经网络和词向量等经典模型的原理和应用技巧,打下深度学习领域的坚实基础,【新】AI算法工程师-深度学习入门官网入口网址
MatAnyone 是一个支持目标指定的稳定视频抠像框架,适用于复杂背景。
BEN2是一个基于深度学习的图像分割模型,专注于背景擦除和前景提取。
Frames 是 Runway 推出的高级图像生成基础模型,提供前所未有的风格控制和视觉保真度。
一个强大的代码生成和理解工具,它通过大规模训练和多样化的模型规模,为开发者提供了一个高性能的编程辅助平台,StarCoder 2官网入口网址
InternLM3-8B-Instruct是一个开源的80亿参数指令模型,用于通用用途和高级推理。
Pyramid-Flow的ComfyUI包装节点,用于高效视觉生成。
革命性深度学习工具,用于面部转换和视频生成。
高质量身份保留的人像动画合成工具。
轻量级端到端文本到语音模型
音乐生成模型,通过控制网络进行微调。
利用AI创作音乐
开源的音乐生成模型
视觉语言模型增强工具,结合生成式视觉编码器和深度广度融合技术。
从单张图片创建全身动态说话头像
深度推理翻译模型,通过长思考链优化神经机器翻译。
从零开始学习深度学习,实现GPT模型,zero_to_gpt官网入口网址
用于视频生成的下一帧预测模型。
开源视频生成模型,支持多种生成任务。
一种通过视觉上下文学习的通用图像生成框架。
通过测试时间缩放显著提升视频生成质量。
实现灵活且高保真度的图像生成,同时保持身份特征。
VLM-R1 是一个稳定且通用的强化视觉语言模型,专注于视觉理解任务。
基于 PyTorch 的音乐、歌曲和音频生成工具包,支持高质量音频生成
一种非侵入式脑机接口技术,通过脑电图或脑磁图解码大脑活动以实现文本输入。
Tarsier 是由字节跳动推出的用于生成高质量视频描述的大型视频语言模型。
VideoLLaMA3是前沿的多模态基础模型,专注于图像和视频理解。
Janus-Pro-1B 是一个统一多模态理解和生成的自回归框架。
生数以其创新的多模态大模型和深度生成式算法研究,为艺术设计、游戏制作、影视后期和内容社交等领域提供了强大的技术支持和解决方案,生数官网入口网址
一款基于Midjourney风格的文本到图像生成模型,专注于高分辨率和写实风格的图像创作。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适