quot;图像理解视频处理多模态模型高效计算低延迟quot;