VideoPrism官网
视频理解基础模型
VideoPrism简介
需求人群:
"- 视频分类、定位\n- 视频检索\n- 视频字幕生成\n- 视频问答\n- 科学视频分析"
使用场景示例:
"- 利用VideoPrism进行视频分类,实现动作识别\n- 应用VideoPrism提取视频特征,检索相似视频\n- 基于VideoPrism为视频自动生成描述文字\n- 与语言模型结合,构建视频问答系统"
产品特色:
– 预训练数据包含3600万高质量视频-文本对,5820万带嘈杂文本的视频剪辑,数据规模最大、质量最高
– 采用两阶段预训练策略,对比学习匹配视频和文本,预测遮蔽的视频块
– 一个固定模型直接适配下游任务,无需调参和微调
– 在30个视频理解基准上刷新最优记录
VideoPrism官网入口网址
https://research.google/pubs/pub52846/
小编发现VideoPrism网站非常受用户欢迎,请访问VideoPrism网址入口试用。
数据统计
数据评估
关于VideoPrism特别声明
本站Home提供的VideoPrism都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由Home实际控制,在2024年 4月 17日 下午9:36收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,Home不承担任何责任。
相关导航
暂无评论...