為了自主飛行,無(wú)人機(jī)需要了解他們?cè)诃h(huán)境中的模式模擬感知并根據(jù)該信息做出決策。卡內(nèi)基梅隆大學(xué)研究人員開(kāi)發(fā)的訓(xùn)練一種新穎方法使無(wú)人機(jī)可以分別學(xué)習(xí)知覺(jué)和動(dòng)作。兩階段方法克服了“模擬與現(xiàn)實(shí)之間的無(wú)人差距”,并創(chuàng)建了一種將完全在模擬數(shù)據(jù)上訓(xùn)練的飛機(jī)無(wú)人機(jī)安全地部署到實(shí)際課程導(dǎo)航中的方法。
“通常即使在最好的研究逼真模擬數(shù)據(jù)上訓(xùn)練的無(wú)人機(jī)在現(xiàn)實(shí)世界中也會(huì)失敗,因?yàn)檎彰鳎褂脭?shù)據(jù)顏色和紋理仍然太不同而無(wú)法轉(zhuǎn)換,交叉駕駛”計(jì)算機(jī)科學(xué)學(xué)院機(jī)器人學(xué)院的模式模擬博士生RogerioBonatti說(shuō)。“我們的訓(xùn)練感知模塊通過(guò)兩種方式進(jìn)行訓(xùn)練,以提高其對(duì)環(huán)境變化的無(wú)人抵抗力。”
第一種方式,飛機(jī)可以幫助訓(xùn)練無(wú)人機(jī)的研究看法是形象。研究人員使用逼真的模擬器創(chuàng)建了一個(gè)環(huán)境,其中包括無(wú)人駕駛飛機(jī),足球場(chǎng)和從地面舉起并隨機(jī)放置以創(chuàng)建軌道的紅色正方形大門。然后,他們從成千上萬(wàn)個(gè)隨機(jī)生成的無(wú)人機(jī)和登機(jī)口構(gòu)造中建立了一個(gè)龐大的模擬圖像數(shù)據(jù)集。
感知所需的第二種方式是知道門在空間中的位置和方向,研究人員使用模擬圖像數(shù)據(jù)集完成了這些操作。
使用多種模式教授模型可以強(qiáng)化對(duì)無(wú)人機(jī)體驗(yàn)的可靠表述,這意味著它可以以從模擬到現(xiàn)實(shí)的轉(zhuǎn)換方式來(lái)理解領(lǐng)域和大門的本質(zhì)。將圖像壓縮為較少的像素有助于此過(guò)程。從低維表示中學(xué)習(xí)可以使模型查看現(xiàn)實(shí)世界中的視覺(jué)噪聲并識(shí)別門。
了解到感知后,研究人員可以在模擬中部署無(wú)人機(jī),以便它可以了解其控制策略或如何進(jìn)行物理移動(dòng)。在這種情況下,它將學(xué)習(xí)在導(dǎo)航路線并遇到每個(gè)閘門時(shí)要應(yīng)用的速度。因?yàn)樗且粋€(gè)模擬環(huán)境,所以程序可以在部署之前計(jì)算出無(wú)人機(jī)的最佳軌跡。與實(shí)際使用專家操作進(jìn)行監(jiān)督學(xué)習(xí)相比,此方法具有優(yōu)勢(shì),因?yàn)楝F(xiàn)實(shí)世界中的學(xué)習(xí)可能很危險(xiǎn),耗時(shí)且昂貴。
無(wú)人機(jī)通過(guò)研究人員指示的培訓(xùn)步驟來(lái)學(xué)習(xí)導(dǎo)航課程。博納蒂說(shuō),他挑戰(zhàn)無(wú)人機(jī)在現(xiàn)實(shí)世界中所需的具體敏捷性和方向。“我使無(wú)人機(jī)以不同的軌跡形狀向左和向右旋轉(zhuǎn),這會(huì)隨著我增加更多的噪音而變得越來(lái)越困難。機(jī)器人并沒(méi)有學(xué)會(huì)通過(guò)任何特定的軌跡來(lái)重新創(chuàng)建。相反,通過(guò)策略性地指導(dǎo)模擬無(wú)人機(jī),學(xué)習(xí)自主運(yùn)動(dòng)的所有元素和類型,”博納蒂說(shuō)。