统一的多模态生成模型,Unified-IO 2官网入口网址
实现增强物体跟踪的Transformer模型,CoTracker官网入口网址
大规模代码生成预训练模型,StarCoder2官网入口网址
FiT是一种基于transformer的无限制分辨率和纵横比的图片生成模型。FiT官网入口网址
Snap视频:用于文本到视频合成的可扩展空间时间转换器,Snap Video官网入口网址
扩展Transformer模型处理无限长输入,Infini-attention官网入口网址
解释视频Transformer决策过程的概念发现,Understanding Video Transformers官网入口网址
谷歌推出的开源预训练语言模型,Gemma-2b官网入口网址
视频理解基础模型,VideoPrism官网入口网址
多语言预训练语言模型,InternLM2官网入口网址
Megatron-LM是一个用于大规模Transformer语言模型训练的开源工具,支持高效的模型并行和多节点预训练,以及混合精度训练,适用于各种自然语言处理任务和大规模数据集的训练,Megatron-LM官网入口网址
Reformer-pytorch是一个高效的Transformer模型,具有LSH attention、可逆网络和分块等特性,适用于自然语言处理和语音识别等任务,Reformer官网入口网址
大型视频语言模型,用于视觉问答和视频字幕生成。VideoLLaMA2-7B-16F-Base官网入口网址
高性能的开源代码模型,Mamba-Codestral-7B-v0.1官网入口网址
7亿参数的语言模型,展示数据整理技术的有效性。DCLM-7B官网入口网址
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适