| EN

公司服务

● 视频及图像识别 >>

SRS 图像识别系统 设计思路: SRS 图像识别系统是一个基于摄像头传感器,用于探测和识别其他交通参与者的外形尺寸与位置,或交通标识与提示信息,提供给无人驾驶车辆的系统。本系统的优点在于精度相较于一般的图像识别项目来说较高,本系统主要设计三大模块:视频采集模块、图像实体识别模块以及图像标定与尺寸计算模块。 视频图像采集模块: SRS的视频图像采集模块主要涉及摄像头对视频的采集。现在标准版的视频图像采集模块将在3秒内完成视频图像采集30-50帧图片,并将关键帧传送给图像实体识别模块,最终将这个系统操作时间控制在系统相应需求内。其中,使用摄像头硬件的性能越好,该功能效果就会更佳。 图像实体识别模块: SRS的图像实体识别模块也就是本系统的核心部分,主要涉及识别交通参与者的尺寸信息(包括其高度与直径,或者高度与宽度)、交通参与者的中心位置(包含径向),交通标识与提示信息,对于这部分我司提供两套解决方案。一、基于传统图像识别技术模版匹配的解决方案。二、基于深度学习resnet、vggnet以及inception的自动化图像识别以及标定的解决方案。按照客户具体需求,我司可以选取并实现最优方案完成项目。
● 基于传统图像识别技术模版匹配的解决方案 该方案主要使用一些传统的图像识别技术包括预处理、特征抽取、分类器设计以及模版匹配。在自动驾驶环境中,由于交通标识与提示信息(包含车道)比较单一尺寸固定,可以采用拍摄各个被识别物体的图片,并将这些图片经过一系列处理做成图像模版,从而比较轻松的定位被识别物体。 本解决方案的优点在于使用的数据量较少,可以较为快速的构造一套较为准确的识别系统。对于自动驾驶,在识别的物体种类固定且数目较少的情况下,该方法可以对交通标识与提示信息(包含车道)提供高品质和高效率的探测。 ● 基于深度学习resnet、vggnet以及inception的自动化图像识别以及标定的解决方案 本解决方案在于使用最新的深度学习图像识别技术来构造一套较为自动化的图像识别以及标定解决方案,本解决方案的具体方法就是基于现有Resnet (深度残差网络) ,对自动驾驶场景所涉及的图片进行一个 fine-tuning 的过程,并最终使现有的深度残差网络学习到自动驾驶的应用场景图片中的元素,使得该网络能够较为有效的应用在自动驾驶场景中。所谓fine-tuning和迁移学习虽然是两个不同的概念。但局限到CNN的训练领域,基本可以将fine-tuning看作是一种迁移学习的方法。举个例子,假设我们有一个新的数据集,让工程师做一下图片分类,这个数据集是关于汽车的。问题是,相对于市面上种类繁多的汽车车型,数据集中汽车的类别很少,数据也不多,从零训练开始训练CNN的效果很差,很容易过拟合。在这种情况下,Transfer Learning成为一种好的解决方案。Transfer Learning用别人已经训练好的Imagenet模型来做。该ImageNet可能本不是用于自动驾驶的,但因为由此得来的ImageNet可以拥有很多带标签的训练集数据,使得预训练的模型(如:CaffeNet)泛化能力得以扩大。无视中间层,仅需要对后几层进行微调,通常应用结果就非常理想。简单来说,我们就是通过一个别人已经使用数以百万计图片构建的模型对我们现有的场景进行微调与适应,使得那数以百万计图片的复杂图像特征都可以应用到本案例中,使得本系统在使用较为少图片的情况下获得较好的准确率。最重要的是,在目标任务上达到很高performance所需要的数据的量相对很少。这样就能够高效并且稳定对自动驾驶的应用场景进行建模从而准确的得到想要的结果。
该方案的另一个优势在于能够使用GPU来解决非常复杂的矩阵与向量运算,在被识别交通参与者种类繁多且形式各异的情况下,依然能够达到较快的响应速度和优异的识别品质。对于普通的机器学习图像识别技术,自动驾驶环境中图像识别的一个重要难点在于环境光在高反光物料上的反射会对图像识别产生干扰,影响图像识别。而我司基于深度学习resnet、vggnet以及inception的自动化图像识别可以自动学习到上述干扰,并很好的解决该问题。
图像标定与尺寸计算模块: SRS的图像标定与尺寸计算模块的功能使最终需求的被识别交通参与者的大小和位置的测量成为可能。该模块在图像识别检测模块检测到具体物体的位置以后,进行一系列图像的处理,包括像素点计算,来确定他们最终的标定位置与大小。并进行第二次模版匹配来保证检测程序的准确度,再最终输出结果。这样就保证了稳定的探测与高质量的测量。