传统图像特征提取方法及其应用
计算机视觉课程报告
一、特征提取方法原理
SIFT(尺度不变特征变换)
原理:
- 尺度空间极值检测:通过高斯差分金字塔检测图像中的关键点
- 关键点定位:通过泰勒展开和Hessian矩阵消除不稳定特征点
- 方向分配:计算关键点邻域梯度方向直方图确定主方向
- 描述子生成:将16x16邻域划分为4x4子区域,每个子区域计算8方 向梯度直方图,形成128维特征向量
梯度计算:m(x,y)θ(x,y)=(L(x+1,y)−L(x−1,y))2+(L(x,y+1)−L(x,y−1))2=arctan(L(x+1,y)−L(x−1,y)L(x,y+1)−L(x,y−1))
LBP(局部二值模式)
原理:
- 邻域比较:对每个像素的3x3邻域进行阈值处理
- 二进制编码:将邻域像素与中心值比较,生成8位二进制数
- 直方图统计:统计图像中不同LBP模式的分布
- 改进方法:圆形邻域(扩展LBP)、均匀模式(Uniform LBP)
HOG(方向梯度直方图)
1. 基本思想
HOG(Histogram of Oriented Gradients)通过统计图像局部区域的梯度方向分布来表征物体特征。其核心假设是:
- 物体形状可由边缘和梯度分布描述
- 局部梯度方向对光照变化具有鲁棒性
2. 数学基础
(这里不清楚是什么原因导致的数学公式反复渲染 会存在一次数学公式和渲染前的文字)
⎩⎨⎧Gx=I(x+1,y)−I(x−1,y)Gy=I(x,y+1)−I(x,y−1)
梯度计算:m(x,y)θ(x,y)=(L(x+1,y)−L(x−1,y))2+(L(x,y+1)−L(x,y−1))2=arctan(L(x+1,y)−L(x−1,y)L(x,y+1)−L(x,y−1))
3. HOG流程