模型输入分辨率

Viewed 169

请问模型输入分辨率model_input_size是指训练前用于标注的照片的分辨率还是rgb888p_size?

1 Answers

都不是,是预处理之后直接送到模型的分辨率。这个需要理解一下:比如yolo模型的输入是320×320,输入的图片可能是各种各样的分辨率的,需要先经过预处理,预处理结束后搞成320×320的,然后再给模型推理,这个320×320才是model_input_size。而rgb888p_size是对摄像头进行设置出图的分辨率,而这个出图是没有经过预处理的。

谢谢。首先声明一下,我是刚接触视觉,对YOLO的了解还很肤浅,所以所问的问题会比较幼稚。对于您的回答,我是否可以这样理解:model_input_size就是预处理后的分辨率?或者说,训练前输入的图片是各种分辨率的,预处理的目的之一就是统一分辨率?又如何知道预处理后的分辨率是多少?

没关系,我只是对这个问题进行说明。预处理有统一分辨率的功能,但又不是只有这一个功能,还有标准化等其他的过程。预处理后的分辨率也就是模型输入的分辨率,这一点和模型的定义有关,使用yolo训练的时候会让你设置一个imgsz参数,这个就是模型的输入分辨率,他在宽高方向上会进行32倍数取整。如果你能导出onnx模型,也可以使用https://netron.app加载onnx模型,查看输入节点的分辨率。其他的模型也是一样的,模型的输入分辨率和模型定义有关。