機(jī)器視覺是通過光學(xué)設(shè)備和非接觸式傳感器自動(dòng)接收和處理真實(shí)物體的圖像,以獲得需要的信息或用于控制機(jī)器人/機(jī)械運(yùn)動(dòng)的設(shè)備。
機(jī)器視覺最早是在1960年代提出的。直到1980年代和1990年代,機(jī)器視覺才迎來了蓬勃的發(fā)展,而在21世紀(jì)之后,機(jī)器視覺技術(shù)進(jìn)入了成熟時(shí)期。
根據(jù)公開數(shù)據(jù),2018年,全球用于工業(yè)自動(dòng)化領(lǐng)域的機(jī)器視覺技術(shù)市場規(guī)模達(dá)到44.4億美元,預(yù)計(jì)2023年將達(dá)到122.9億美元,復(fù)合年增長率為21%。
與全球機(jī)器視覺產(chǎn)業(yè)相比,中國的機(jī)器視覺相關(guān)產(chǎn)業(yè)起步較晚,但發(fā)展迅速。從2011年到2019年,中國的機(jī)器視覺市場已從10億元躍升至100億元,并保持每年兩位數(shù)的增長速度。目前,我國已成為僅次于美國和日本的世界第三大機(jī)器視覺市場。
2020年新冠疫情的爆發(fā),雖然對整個(gè)行業(yè)產(chǎn)生了一定影響,但卻成了機(jī)器視覺最大的“訓(xùn)練場”,如:無人機(jī)噴灑消毒、機(jī)器人非接觸式配送等,加速了公眾對機(jī)器人的認(rèn)知,從長遠(yuǎn)來看,這無疑將加速機(jī)器視覺行業(yè)的發(fā)展進(jìn)程,各個(gè)行業(yè)將使用機(jī)器視覺的功能特性更加多樣化,這將促進(jìn)該行業(yè)的全面升級。
一、導(dǎo)航和定位
實(shí)際上,對于人眼來說,導(dǎo)航和定位是通過兩只眼睛確定目標(biāo)對象的相對位置和絕對位置。對于機(jī)器,它需要?jiǎng)?chuàng)建一對“眼睛”——3D視覺。
對于3D視覺,首先要談?wù)?D視覺的測量原理。當(dāng)前市場上有四種主要的3D視覺測量技術(shù):雙目視覺,TOF,結(jié)構(gòu)光和激光三角測量。
1、雙目技術(shù),目前是相對廣泛的3D視覺系統(tǒng)。它的原理就像我們的兩只眼睛,用兩個(gè)視點(diǎn)觀察同一景物以獲得不同視角的感知圖像,然后使用三角測量原理計(jì)算圖像的視差以獲得景物的三維信息。
雙目視覺對硬件的要求較低,因此可以在一定程度上控制成本。但是,它對環(huán)境照明非常敏感。受環(huán)境因素的影響,例如照明角度和照明強(qiáng)度的變化,將導(dǎo)致所拍攝圖片的亮度差異很大,這無疑增加了算法的要求。另外,相機(jī)基線(兩個(gè)相機(jī)之間的距離)限制了測量范圍。測量范圍與基線有很大關(guān)系:基線越大,測量范圍越遠(yuǎn);基線越小,測量范圍越近。
雙目視覺的優(yōu)缺點(diǎn)決定了它更適合在生產(chǎn)現(xiàn)場的在線,產(chǎn)品檢測和質(zhì)量控制。當(dāng)然,某些產(chǎn)品也使用此技術(shù)原理,例如基于slam算法導(dǎo)航和定位的終端產(chǎn)品,體感攝像頭等。
2、TOF(全名:TimeOfFlight)飛行時(shí)間成像技術(shù),其原理是連續(xù)向目標(biāo)發(fā)射光脈沖,然后使用傳感器接收從物體返回的光,通過探測光脈沖的飛行時(shí)間來獲得目標(biāo)物距離。
TOF的核心組件是光源和光接收模塊。它不需要類似雙目視覺算法即可進(jìn)行計(jì)算。它可以通過特定公式直接輸出對象的深度信息。因此,它具有響應(yīng)速度快,軟件簡單,識別距離長的特點(diǎn)。因?yàn)椴恍枰@取和分析灰度圖像,所以它不受外部光源的表面特性的影響。但是,TOF技術(shù)的缺點(diǎn)是分辨率低且無法精確成像。
這就決定了TOF技術(shù)更適合于遠(yuǎn)程3D信息收集。最常見的是自動(dòng)駕駛領(lǐng)域的激光雷達(dá)。但是,由于自動(dòng)駕駛行業(yè)的發(fā)展特點(diǎn),該領(lǐng)域的激光雷達(dá)公司并不多。主要公司已經(jīng)占領(lǐng)了市場份額,后來進(jìn)入者的市場門檻已經(jīng)很高。近年來,隨著掃地機(jī)器人在ToC市場中的市場份額不斷增長,許多公司正在考慮使用TOF技術(shù)進(jìn)入該領(lǐng)域,并在其中占有一定份額。但是,TOF技術(shù)公司面臨的主要問題是如何降低成本,讓我們拭目以待。
3、結(jié)構(gòu)光技術(shù),該技術(shù)是通過一個(gè)光源投射聘束結(jié)構(gòu)光,打到要測量的對象上,因?yàn)椴煌膶ο缶哂胁煌男螤睿@將導(dǎo)致由于一些條紋或斑點(diǎn)而導(dǎo)致的不同變形。發(fā)生這種變形后,就需要通過算法計(jì)算出距離,形狀,大小和其他信息,以獲得物體的三維圖像。
結(jié)構(gòu)光技術(shù)不需要使用非常精確的時(shí)間延遲來測量,而且解決了雙目匹配算法的復(fù)雜性和魯棒性問題,因此具有計(jì)算簡單,測量精度高的優(yōu)點(diǎn)。而且由于沒有明顯的紋理和形狀變化,因而同樣可以精確測量,因此越來越多的行業(yè)應(yīng)用使用結(jié)構(gòu)光技術(shù)。最常見的一種是手機(jī)的面部識別。
4、激光三角測距技術(shù),也是一種幾何測量方法。本質(zhì)上,它使用物體之間的三角幾何關(guān)系進(jìn)行距離測量。典型的應(yīng)用是使用激光作為光源的測量方案,該方案也基于光學(xué)幾何原理,并根據(jù)光源、物體和檢測器三者之間的幾何成像關(guān)系確定空間物體各點(diǎn)的三維坐標(biāo)。
這種方法通常使用激光作為光源,并使用CCD/CMOS相機(jī)作為檢測器,具有結(jié)構(gòu)光3D視覺的準(zhǔn)確,快速和低成本的優(yōu)點(diǎn)。根據(jù)幾何原理的計(jì)算,被測物體越近,CCD/CMOS上的位置差別越大,分辨率和精度越高。所以這種測量法在中近距離下的精度很高,特別適合中近距離測距,已成為室內(nèi)機(jī)器人測距定位的首選。
二、外觀檢查
外觀檢查是通過圖像處理技術(shù)完成的。圖像處理實(shí)際上是圖像信息的計(jì)算機(jī)處理。
圖像處理的主要目的是三個(gè)方面:提高圖像的視感質(zhì)量,提取圖像中包含的某些特征或特殊信息,對圖像數(shù)據(jù)進(jìn)行轉(zhuǎn)換,編碼和壓縮,以便于圖像的存儲和傳輸。而這些是檢查生產(chǎn)線上產(chǎn)品質(zhì)量問題的最佳應(yīng)用,這個(gè)環(huán)節(jié)也是替代勞動(dòng)力的最重要部分。
此外,它在其他領(lǐng)域也有應(yīng)用,例如生成原始圖像的預(yù)覽圖,將相機(jī)安裝在汽車或無人駕駛飛機(jī)上以及使用圖像處理技術(shù)來處理相機(jī)拍攝的照片。
三、識別
從字面上可以看出,識別是一個(gè)認(rèn)識加辨別的過程,需要對機(jī)器進(jìn)行類似人的判斷。因此,識別主要通過圖像處理和深度學(xué)習(xí)的融合來實(shí)現(xiàn)此功能。
圖像處理把外部對象的信息轉(zhuǎn)換為機(jī)器語言,然后通過視覺感知完成信息的輸入。這個(gè)過程本質(zhì)上是機(jī)器學(xué)習(xí)的過程,將兩者疊加融合以使識別功能智能化。最常見的應(yīng)用是人臉識別和無人駕駛。
四、高精度檢測
高精度檢測實(shí)際上與第一個(gè)導(dǎo)航和定位功能原理相同。不同之處在于,它可能會把多種測量技術(shù)融合在一起,以形成一個(gè)高精度的檢測系統(tǒng)。
因?yàn)槭褂酶呔葯z測的行業(yè)通常在諸如精密加工和高端工業(yè)制造之類的高要求行業(yè)中,所以要求檢測精度達(dá)到um級。這些是人眼無法檢測到的,必須由機(jī)器完成。這也已成為工業(yè)4.0時(shí)代工業(yè)自動(dòng)化的關(guān)鍵應(yīng)用。
人工智能和“中國制造2025”戰(zhàn)略的深入下行,勢必給機(jī)器視覺需求帶來持續(xù)增長。
機(jī)器視覺是一個(gè)技術(shù)密集型產(chǎn)業(yè)。核心技術(shù)的積累和持續(xù)的技術(shù)創(chuàng)新是企業(yè)獲得競爭優(yōu)勢的關(guān)鍵因素之一。我們期待出現(xiàn)更多的行業(yè)杰出人士,為整個(gè)行業(yè)的發(fā)展做出貢獻(xiàn)。