论文研究 最优化凸分组在目标检测中的应用研究.pdf
针对不同场景下静态图像中单目标的检测问题,结合自然界各个目标特有的凸属性特点,提出了一种基于最优化凸分组的目标检测方法。比较系统地论述了最优化凸分组的基本原理,介绍了详细的实现过程,主要包括Canny边缘检测参数的设置、基于边缘点的线段拟合、凸分组中凸多边形的构造以及最优化凸多边形的判定。实验结果表明,该方法对任意场景下的单目标检出率和检测准确性良好,结合目标凸属性的最优化判定方式具有检出速度快,且不受机器学习中的样本数据影响的特点,具有很好的普遍适应性。吴健辉,李交杰,张国云,等:最优化凸分组在目标检测中的应用研究2016,52(17)2171,2,…,n),则线段长度利占整个多边形边界长度和的算法之一,其检测过程如下,首先是采用窗凵可调的高比例为斯滤波算法对图像进行平滑滤波,降低噪声对图像边缘的影响;然后计算图像梯度,采用非最大抑制技术消除(3)可能的边缘误检,并应用双阙值方式来对边界进行判L+∑G定,最后再对判定为边界的点进行跟踪,完成所有边界的检测。 Canny算子具有多个可调参数,根据不同的边其中L1为所构造的凸多边形中线段的总长度,G,n为缘检测需求,通过调整参数,可以实现对任意目标的边空隙的总长度。界提取。由实验可知如果某个凸多边形中间隙的总长度大3.2线段拟合于或等于线段的总长,则所构造的凸多边形不可能是真目标图像的边缘检测出来后,需要对边缘进行直线实日标所在,即式(3)中,如果σ≤0.5,则无论是否凸集拟合,即根据边缘的分布情况将边缘点拟合成线段,然均可判定为非目标组合。后再用线段构造多边形。线段的拟合采用搜索算法完23最优化凸分组判定成,其搜索过程如图3所示。搜索分两个方向,首先水对按凸分组规则构造的各个凸集进行判定,选择出平方向搜索,然后垂直方向搜索。其水平算法步骤如最优的凸集对应的多边形作为目标的检出边界。凸多下,垂直搜索过程类似。边形的边界山线段和填充空隙两部分构成,将其边界长(1)从 Canny边缘图像的左上角第一个像素作为搜度、包含区域的梯度以及面积用一个函数进行度量,构索起始点,选择三个相邻像素进行判定,因为Cany算造的最优化凸分组判定函数如式(4)所示子检测后的输岀边缘为单像素二值化图像,像素为1是∫nxd+』v(u,)ady边缘,否则为非边缘BL+D(4)(2)如果三个像素中有一个为1,则选择该点作为拟l dudu合起始点并进行标注,重复步骤(1);如果三个像素点中式(4)中B表示闭合的凸多边形边界,为调节参数;有两个1或者都为1,则同样都标注为起始点,依次以各o(0.为边界B的构造函数,(d为计算边界线段和起始点选择后面三个像素点进行判定空隙的数量,间隙取1,线段取0;V((u,ν)为梯度计算3)当搜索到某个点时其后续三个点的像素均为0,则中淅搜索,对前面已经标注到的搜索点进行判定,如V(,)dd即计算区城内水平梯度和垂直梯度两果连续像素小丁10个,则丢弃;香则以50个像素为一组个方向的总梯度值: [duds为×域R的面积。当完成进行线性拟合成线段(大于10小于50个的同样拟合成线段对所有的凸多边形判定后,(B)最小的那个即为最优(4)重复上面三个步骤,直到全部像素扌描完毕化凸多边形。3最优化凸分组目标检测过程根据最优化凸分组原理,最优化凸分组目标检测过程分为三个主要步骤。首先对输入的原图像采用边缘检测方式分割出各种可能日标的边缘;然后对边缘进行线性拟合,应用凸分组规则构造各个凸多边形分组:最后再应用最优化凸分组判定准则对各个检测出来的封闭凸多边形进行判定,从而找的一个最优的多边形作为潜在目标的边界,其检测流程如图2所示。输入待检测图cany边边缘点像(128×96)检测拟合口标区域最优凸多凸多边边形选取形构造图3线段拟合搜索示意图图2最优化凸分组目标检测流程而对于垂直搜索,只需将选择像素点置于下方即31Cany边缘检测可。通过水平和垂直搜索后,全部边缘像素点将拟合成Canny边缘检測算子是H前图像边缘检测的经典对应的线段,同时对于小尺度的边缘进行筛除,保证拟2182016,52(17)Computer Engineering and Applications计算机工程与应用合的线段尽可能为真实的边缘构成。缘,因此需要对 Canny参数进行反复调整修改,不断改3.3构造凸多边形及最优化判定变Cany算法的高斯参数和阈值,最后通过对比选择出采用凸多边形的构造规则,将拟合出的线段作为一最佳的参数设置。针对某样本图片,部分不同参数的个集合进行凸多边形构造。保留符合要求的凸分组,删cany边缘检测结果如图6所示。除重复和不满足要求的凸分组。同时考虑到边缘检测通常在拐角点和连接点更容易受到干扰,如图4(a)所示,线段L2的端点P2可能受到噪声干扰而延长,此时对PP2进行连合,则M1P1P2M2为非凸结构,但是线段L1和L2又可能是真实目标的边缘拟合线段,所以为了(a)原图(b)歲值0.1高期-1(c)阈值0.1高斯-5更好地提升目标凸集检测的有效性,对于图4(a)这样的非凸线段组合,将线段L1进行延长,其延长线与L2的交点作为多边形的顶点如图4(b)所示,从而保证其所构造多边形的凸性,保证潜在H标凸多边形的检出准确率。(d)阈值-0.2高斯-1(e)阈值-0.2高斯-9(f阈值-0.3高斯(g)國值-0.3_高斯-9(h)值-0.4高斯-1(i)阙值0.5高斯-1(a)处理前为非凸集(b)处理后为凸集图6各种不同参数下的Cany边缘检测效果图4边界特殊间隙构造处理通过对各个不同参数下的 Canny边缘结果对比分凸多边形构造完毕后,应用最优判定函数对构造的析,当阈值与高斯窗口增时,能检测到的边缘数量减各个凸多边形进行判定,并结合目标的特点对调节系数少,当能检测到的边缘少于定量时有可能丢失目标进行调整使得检测出的最优凸分组尽可能多地包含目边缘,结合处理速度和检测效果,对背景简单的片,将标区域,从而实现对图像中目标的检测。高斯滤波窗凵选1,阈值选0.1,对背景复杂的图片,则高斯滤波窗口选3,國值选0.1。实验结果及分析4.2边绦线段拟合及凸多边形构造结果本文测试数据厍为网上下载的自建数据集,共有对Cany边缘检测后的结果进行线性拟合,其拟合320张只含单H标的静态图片,其待检测的H标包括人结果如图7所示。在拟合过程中,删除连续像素小丁10脸、行人、车钢以及其他各种目标。图片进行预处理后的拟合线,对直线进行50个像素拟合成段,保证轮均归一化为128×96的jpg格式彩色图片,实验测试平台廓的完整性。从图7(b)中可以看出,所拟合的直线与边采用戴尔T550形T作站,其配置为 Xeon562CPU,缘点的轮廓吻合良好,目标所在位置特征明显。图7(c6GB内存,软件平台为 MATLAB2013。部分图像样本拟合后直线叠加在原图上的效果,线条与目标边缘能如图5所示。很好地吻合。通过对图7(b)拟合后的线段采用凸多边形的构造准则进行分组,构造后的部分凸多边形结果如图7(d)-(f)所示。(a) Canny边缘b)直线拟合结果(c)叠加效果图5部分样本图片41 Canny边缘检测结果在最优化凸分组目标检测中,为了保证所有目标的(d)凸多边形1e)凸多边形2(f)凸多边形3边缘点都能被检测到,但又要尽可能多地消除非目标边图7边缘拟合及凸多边形构造结果吴健辉,李交杰,张国云,等:最优化凸分组在目标检测中的应用研究2016,52(17)2194.3最优凸多边形判定结果Network的机器学习方法,减少了因训练数据库的不同采用凸多边形最优判定函数对构造的各个凸多边而带来的不同目标检测的准确性问题,因而针对各种不形进行判妵,最优凸多边形所对应的目标区域如图8所同类型的目标,其检测准确率更高,误检率更低,只有良示。从图屮可以看出,所检测到的最优凸多边形所对应好的通用性。而针对特征的日标检测,例如不变矩特的区城为待检测的目标区域,检测效果良好。征,本文方法同样在准确率上更高,特别是在检测时间上更有优势。这些都是由本文方法中凸特性作为H标特有的自然属性的特点决定的,因而针对实际目标其检测准确性更好。同时本文的最优化凸分组判定决定了目标检测的唯·性,即不可能在单目标图片屮同时检测(a)最优凸多边形(b)对应的目标区域出多个目标,更能应用到实际目标检测中。图8最优多边形判定及目标检测结果表1不同检测方法结果对比44目标检测结果及分析目标检训练检测检测方法准确率/采用同样的方法对320个样本图片中的目标进行出率/%时间/min时间/ms不变矩特征94.584826.70了检测实验,部分检测结果如图9所示,从图屮可以看311.60出,本文方法对背景较简单的单一H标有很好的检测效ada boost90.243果,无论目标处亍什么形态,无论光线强弱,均能准确榆Neural network 97.35737.25测到目标所在的区域,尽管部分检测结果中对目标的提本文方法95.8536.80取范围较人,超过了真正目标的区城,但确侏了目标检測的准确性。同时多个实验结果表明,该方法对人脸检5结语测具有特殊的优势,无论是正面、侧面述是其他姿态,甚本文根据自然界各个目标特有的凸性特点,将最优至背面或者受到部分遮挡,均能很好地检测岀人朎所在化凸分组应用到目标检测屮,解决了目标形态和环境光位置,具有很好的鲁棒性。线的影响,取得了很好的检测效果,基本达到了实际应用的H的。但由于凸多边形构造中的线段直接来源于图像的Cany边缘,囚此 Canny边缘检测算子的参数设置会直接影响到最终目标的检杳结果,如果设置值较小,则边缘拟合线段较多,可以提升目标的检出率和准确率,但执行时间将会加大;如果设置值较大,边缘拟合线段减少,可能出现找不到最优凸集而降低检出率和日标检测准确率。囚此在实际应用中可以根据待检测目标的特点适当调整 Canny边缘检测参数,达到最佳的目标检测效果。在下一步的研究中,可以针对静态目标的属性研究改进的Cany算法,进一步提升边缘检测的效率;同时目前本文只针对单目标进行了检测,在下·步的研究中通过优化和改进最优凸多边形的判定函数,争取将其应用到多静态H标的检测中来,充分发挥其在静态目标检测中的应用价值图9部分样本检测结果参考文献:[1 Freund Y. An adaptive version of the boost by majorily本文方法与4个典型的目标检测方法的检查准确algorithm [J]. Machine Learning, 2001, 43(3): 293-318性及耗时对比如表1所示,其中“目杯检出率”表示从图21李小红,谢成明,贾易臻,等基于OR特征的快速目标检片中找到了目标区域,可能是真实的目标区域,也可能测算法[J电子测量与仪器学报,2013(5):455460是错误的区域;“准确率”指的是准确检测到真实H标的[3] Zhang H, Gao W, Chen X, et al. Object detection using几率。从表中可以看出,针对单目标,本文的目标检出spatial histogram features]. Image and vision Comput-率和检测准确率接近,且检测准确率达到94.2%,证明ing,2006,24(4):327-341了目标检测的高可靠性。相比SVM、 Adaboost和 Neural(下转228页)
用户评论