前言
目前,全景图像拼接方法虽然已日趋完善和成熟,但是因拼接算法效果受图像内容影响较大,在处理大场景等特殊情况时往往无法获得较好的拼接效果。此外,在图像采集过程中光照及颜色不均也会影响特征信息准确度而造成拼接成功率降低,而这种情况在实际场景中不可避免。因此,研发了一种大场景下全景图像拼接方法。
1 关键技术
大场景下全景图像拼接,通过自适应Gamma(即灰度系数)校正的色彩增强算法,实现输入图像色彩增强;运用YUV空间的局部均值统计方法,进行光照均衡处理;YUV是编译true-color颜色空间(color space)的种类,Y'UV, YUV, YCbCr,YPbPr等专有名词都可以称为YUV,彼此有重叠。“Y”表示明亮度(Luminance或Luma),也就是灰阶值,“U”和“V”表示的则是色度(Chrominance或Chroma),“U”和“V”描述的是影像色彩及饱和度,作用在指定像素的颜色。在上述预处理步骤的前提下,使用用柱面投影模型,将处理后的图像投影至柱平面上;对上述所有图像进行分组,按照3个为一组的方法,相邻组之间有一副图像完全相同,依次开始下面的处理。
柱面投影后的图像采用特征点检测算法,该检测算法基于网格均匀化的shift-Tomasi与Sift(尺度不变特征变换)相结合,对应用场景中的建筑物等特征点进行检测,并通过k-d(k维树的缩写)树的最临近搜索方法对图像间检测出的特征点进行粗略匹配,得到匹配的特征点。
2 图像拼接流程
针对应用场景,运用Harris角点作为待匹配特征点的方法,为了减少无效特征点对配准的干扰影响,采用SIFT描述符技术,特征点描述符的技术实现对场大景图像的检测,对特征点的筛选使用RANSAC算法,这是图像融合拼接的输入方法,能最大避免去除错配对对全局匹配的影响。图像融合拼接的关键两步是:配准(registration)和融合(blending)。根据几何运动模型,配准的目的是将图像注册到同一个坐标系中。融合的目的是将配准后的图像合成为一张大的拼接图像。为解决多幅图像的配准,使用透视模型作为几何运动模型。图像的透视模型是具有8个参数的变换模型,可以完美地表述各种表换,是一种最为精确变换模型,变换公式如下:
图像融合采用的是线性插值混合算法,使用线性加权过渡函数的方法,实现了在接近重叠区域边界的地方做平滑过渡处理。图像重叠区域内使用两幅图像共同的贡献值就生成了混合图像的灰度值,假设过渡区域为50,则其权值渐变因子的变化曲线如图 1所示。
图 1 融合权值变化曲线
精确匹配的特征点,通过几次筛选后得到,进而能够估算出最优的配准单应矩阵,评价模型所用的代价函数计算公式如下:
图像的配准拼接处理,采用单应性矩阵技术,并使用渐入渐出融合方法实现图像间拼接缝隙的平滑过渡。如果所有分组均处理完成,拼接后生成的新图像组可以作为重新输入,开始从柱面投影模型,直到输出图像全部结束,这时形成的图像为拼接成功的全景图像。
对全景图像采用Canny边缘检测,边缘检测算法被很多人认为是边缘检测的 最优算法, 最优边缘检测的三个主要评价标准是:低错误率、高定位性、最小响应。依据现场情况的特点,找出天际线的位置,天际线圆滑曲线的拟合,使用的是最小二乘法,映射关系为全图映射关系,能够有效的避免因拼接造成的图像变形扭曲,最终生成拼接全景图,如图 2所示。
图 2全景拼接流程图
3全景视频拼接方法实现
视频监控与试验图像通信分系统中全景视频拼接软件基于视频拼接关键技术进行设计。多路高清相机输入视频流信息,摄像头控制信息。全景视频拼接软件输出控制信息对摄像头进行操控,输出拼接参数信息和色彩校正参数信息给智能管理平台进行记录,输出拼接完成的视频流信息至外部显示设备进行显示,输出视频流信息给智能分析软件进行分析。
[参考文献]
[1] 钟力,胡晓峰.重叠图象拼接算法[J].中国图象图形学报,2008,4.
[2] 王国东,文鹏程,程岳.一种利用ORB特征进行航拍图像拼接的方法[J].《内蒙古师范大学学报:自然科学版》,2014.
[3] 陶菁,李毅.基于SIFT特征点的机场场面视频的实时拼接[J].现代计算机,2018.2.