超像素分割之SLIC

论文简介

论文的一些特色

与meanshift的2点区别

  • 将搜索空间缩小至与超像素大小成比例的区域,大大减小了距离计算的时间复杂度,最终所有超像素的距离计算量与超像素的个数无关,只与图像大小有关。
  • 使用颜色和空间的相似度来进行距离度量,避免生成的超像素尺寸太大,同时保证超像素的紧凑度。

时间复杂度

  • 属于迭代优化的过程,时间复杂度为$O(N)$,与设定的超像素的个数无关。

主要步骤

  • 对于RGB图像,首先转换到LAB颜色空间,结合位置,对于每个pixel,构造得到$[l,a,b,x,y]$的特征向量。
  • 首先均匀生成k个初始点(k为超像素个数),然后在3X3的区域内重新插选取种子点,使新的种子点落在该邻域内梯度最小的地方。这是为了避免种子点落在梯度较大的轮廓边界上。
  • 确定边长为2S($S = \sqrt {N/k}$)的正方形搜索区域,计算该区域内的所有pixel的特征向量与种子点的距离。距离的具体计算方法在论文中,主要就是颜色空间的距离与位置空间的距离的非线性加权。因为搜索区域较大,因此每个pixel可能会被多次计算,取距离的最小值对应的种子点的label作为该pixel最终的label。
  • 迭代优化,直到所有的种子点的中心都不再发生变化。一般取迭代次数为10即可达到比较好的迭代效果。
  • 后处理,使用连通区域的方法,为一些孤立的pixel分配离它最近的聚类中心的label,这也会使得一些属于同一label、却不连通的超像素之间进行合并。