1. 什么(me)是视觉
视觉是一个古(gǔ)老的研究课题,同时(shí)又是人类观(guān)察世界、认知世界的重要功能(néng)和(hé)手(shǒu)段。人类从外界获得的信息约有(yǒu)75%来自视觉系(xì)统,用机器模拟人(rén)类的视觉功能是人们多年的梦(mèng)想。视觉神经生理学(xué),视觉心(xīn)里学,特别是计算机技术(shù)、数字(zì)图像处理、计算(suàn)机(jī)图形学、人工智(zhì)能(néng)等学科(kē)的发展,为利用(yòng)计算机实现模(mó)拟人类的(de)视觉成(chéng)为(wéi)可能。在现代工(gōng)业自(zì)动(dòng)化生产过(guò)程中(zhōng),计算机视觉正成(chéng)为一种提高(gāo)生产效率和检验产品(pǐn)质量的关(guān)键技术之一,如机(jī)器(qì)零(líng)件的(de)自动检(jiǎn)测、智能机器人控制、生(shēng)产线的自动监控等;在国防和航天等领域,计算机视觉也具有较重(chóng)要的(de)意义,如运动目(mù)标的(de)自(zì)动跟踪与识别、自主车导航(háng)及(jí)空间机器(qì)人的视(shì)觉控制等。
人类视觉过程可以看(kàn)作是一(yī)个从感(gǎn)觉(jiào)到知觉的复杂(zá)过程,从狭义(yì)上来说视觉的最终目的是要对场景(jǐng)作(zuò)出对(duì)观察者有意义的解释和描述;从广义上(shàng)说(shuō),是根据周围(wéi)的环境和观(guān)察者的意愿,在(zài)解释和描述的基础上(shàng)做(zuò)出行为规划或行为(wéi)决策(cè)。计算机视觉研究(jiū)的目的使计算机具有通过二维图像(xiàng)信息来认(rèn)知三维环境(jìng)信息的能(néng)力,这种能力不仅(jǐn)使机(jī)器(qì)能感知三维环境中物体的几何信息(xī)(如形状、位置、姿态(tài)运动等),而且(qiě)能(néng)进一步对(duì)它(tā)们进行描述、存储(chǔ)、识别与理解,计算机视觉己(jǐ)经发展起一(yī)套独立的计(jì)算(suàn)理(lǐ)论与算法。
2. 什么是计算机双(shuāng)目立体视觉
双目立体(tǐ)视觉(Binocular Stereo Vision)是机器视觉的一种重要形式,它是基于视(shì)差原理并利用成像设备(bèi)从(cóng)不同的位置获取被测(cè)物体(tǐ)的两(liǎng)幅图像,通(tōng)过计(jì)算(suàn)图(tú)像对应点间(jiān)的位置偏差,来获取物体三维(wéi)几何(hé)信息的方(fāng)法。融合两只眼睛获(huò)得的图像并观察(chá)它们(men)之间的(de)差别,使我们可以获得明显的深(shēn)度感(gǎn),建立(lì)特征间的对应关系,将同一空间物理点在不同(tóng)图(tú)像中的映像点(diǎn)对应起来(lái),这(zhè)个(gè)差别,我们称作视差(Disparity)图像。
双目立体视觉测量方法具有效(xiào)率高(gāo)、精度(dù)合(hé)适、系统结构简单、成本低等(děng)优点(diǎn),非常适合于制造现场的在(zài)线、非接触产品检测和(hé)质量(liàng)控(kòng)制(zhì)。对(duì)运动物体(包括(kuò)动物和人体形体)测(cè)量中,由于图像获(huò)取是在瞬间完成的,因此立体视(shì)觉(jiào)方法是一种更有效的测量方法。双目立体视觉(jiào)系统是计算(suàn)机视(shì)觉的关键技术之(zhī)一(yī),获取(qǔ)空间(jiān)三维场景的距离信(xìn)息(xī)也是计(jì)算机视觉研究中最(zuì)基础的(de)内(nèi)容。
双(shuāng)目立体视觉(jiào)的(de)开创性(xìng)工作始于(yú)上世纪(jì)的(de)60年代中期。美国MIT的Roberts通过从数字(zì)图像中(zhōng)提取立方体、楔形体(tǐ)和(hé)棱柱体等(děng)简单规则(zé)多(duō)面体的三维(wéi)结构,并对(duì)物体的形(xíng)状和空间(jiān)关系进行描述(shù),把过去的简单二(èr)维图像(xiàng)分析推广(guǎng)到了复杂(zá)的三维场景,标志着立体视觉技术的诞生。随(suí)着研究的深入,研究的范围(wéi)从边缘(yuán)、角点等特征的提取,线条、平面、曲面等几何要素的分析,直到对图像明暗、纹理、运动(dòng)和成像几何等进行分析,并建立起各种数据结构和推理规则。特别(bié)是上世纪80年代初,Marr首(shǒu)次将(jiāng)图(tú)像处理、心理物理学、神经生理学(xué)和临床(chuáng)精神病学的研究(jiū)成果从信息处理的角度进行概括,创(chuàng)立了视觉(jiào)计算理论框架。这一基本理论对立体(tǐ)视觉技(jì)术的发展(zhǎn)产生了极大的推动(dòng)作用,在这一领域(yù)已形成了(le)从图像的获取到最终的(de)三维(wéi)场(chǎng)景可视表面重构(gòu)的完整体系(xì),使(shǐ)得立体(tǐ)视觉已成为计(jì)算机视觉中一(yī)个非(fēi)常重要(yào)的分(fèn)支。
3、总结
经过几十年来(lái)的发展,立体视觉(jiào)在机(jī)器人视觉、航空(kōng)测绘、反求工(gōng)程、军事运(yùn)用、医(yī)学成(chéng)像(xiàng)和工业检测等领域中的运(yùn)用越来越广。
以视觉系统(tǒng)为基础的三维非接触式高速测量(liàng)是(shì)一个(gè)重要的研究方向,双目立(lì)体视觉方法是其中一种(zhǒng)最(zuì)常用(yòng)的方法。为了能够将这些技术应用在实际的无人机项目中,需要尽可能提高算法的(de)效(xiào)率与精度。

咨询航拍服务可加(jiā)昆(kūn)明俊鹰无人机飞控(kòng)手老鹰的微信laoyingfly |