深度学习中的patch是什么?

patch可以通俗地理解为图像块,当需要处理的图像分辨率太大而资源受限(比如显存、算力等)时,就可以将图像划分成一个个小块,这些小的图像块就是patch。

基于上述另外补充一点:为何要划分patch而不使用resize缩小分辨率呢

通常情况下,resize没有太大问题。但在处理图像分割问题时,由于是dense prediction,属于像素级的预测,因此会尽量要求精确。

而resize操作大多是对图像进行插值处理,本质上一种滤波,在像素级别上会造成损失(对传统图像处理有了解的应该知道某些滤波效果会使图像变得模糊),即:某些位置上的像素值是通过多个位置加权计算出来的,从而限制了模型预测结果的上限。因为你给的源图像本来就是不精确的,基于这不精确的源信号作为监督,训练出来的模型性能自然就局限在那里了。

相对地,划分patch只是把原来的大图分成一个个小图,而这些小图依然是原图的部分,像素值没有改动,因而在理论上,训练出来模型的上限能够比基于resize得到的图像训练来的高。

作者:芝士不知世_原文地址:https://blog.csdn.net/weixin_54338498/article/details/125611770

%s 个评论

要回复文章请先登录注册