ROI Pooling(感兴趣区域池化):计算机视觉中常用的一种操作,用于把不同大小的候选区域(RoI, Region of Interest)从特征图上裁剪并映射为固定尺寸(如 7×7)的特征,以便后续的分类与边界框回归等任务能够使用统一形状的输入。常见于两阶段目标检测模型中。(注:相关方法还有 RoI Align 等。)
/ˌɑːr oʊ ˈaɪ ˈpuːlɪŋ/
We use ROI pooling to convert each proposal into a fixed-size feature map.
我们使用 ROI pooling 将每个候选框转换为固定尺寸的特征图。
Because ROI pooling quantizes coordinates, it may cause slight misalignment for small objects.
由于 ROI pooling 会对坐标进行量化(取整),在处理小目标时可能带来轻微的对齐误差。
“ROI”是 Region of Interest(感兴趣区域)的缩写;“pooling”源自深度学习中的池化操作(如 max pooling/average pooling),表示通过分块汇聚把特征压缩到更小、更规整的形状。“ROI pooling”这一术语随着两阶段检测框架(如 R-CNN 系列)在学术论文与工程实现中普及而固定下来。