MIT工程師研發多機器人系統安全訓練方法,保障密集環境運作安全
無人機表演是愈來愈受歡迎的大型燈光展示形式。這些表演會動用數百到數千架空中機器人,每架都經過程式設計,沿特定路徑飛行,共同在天空中形成複雜的形狀和圖案。若一切按計劃進行,無人機表演會非常壯觀。但要是有一架或多架無人機發生故障,就像最近在佛羅裡達州、紐約等地發生的那樣,對地面上的觀眾來說可能會是嚴重的危險。
無人機表演事故凸顯了工程師所謂「多智慧體系統」維持安全的挑戰。多智慧體系統是由多個經過協調、合作且由電腦程式設計的智慧體組成的系統,像是機器人、無人機和自動駕駛汽車等。
如今,麻省理工學院(MIT)的一個工程師團隊開發出一種多智慧體系統的訓練方法,能確保它們在擁擠環境中安全運作。研究人員發現,一旦用這種方法訓練少量智慧體,這些智慧體學到的安全邊界和控制方法,就能自動擴充套件到任意數量更多的智慧體,從而確保整個系統的安全。
在實際演示中,該團隊訓練了少量手掌大小的無人機,讓它們安全地完成不同任務,從在空中同時切換位置,到降落在地面指定的移動車輛上。在模擬中,研究人員展示了在少量無人機上訓練的相同程式,可以複製並擴充套件到數千架無人機,使大量智慧體組成的系統能安全地完成相同任務。
麻省理工學院航空航天學副教授範楚楚表示:「對於任何需要一群智慧體的應用,像是倉庫機器人、搜救無人機和自動駕駛汽車等,這都可能成為一種標準。這就像是提供了一個盾牌,或是安全過濾器,告訴每個智慧體可以繼續執行任務,並指導它們如何保障安全。」
範楚楚和她的同事們在本月發表於《IEEE 機器人學會刊》的一項研究中報告了他們的新方法。該研究的共同作者包括麻省理工學院的研究生張鬆源、Oswin So,以及前麻省理工學院博士後研究員 Kunal Garg,他現在是亞利桑那州立大學的助理教授。
工程師在設計任何多智慧體系統的安全機制時,通常必須考慮系統中每個智慧體相對於其他所有智慧體的潛在路徑。這種逐對的路徑規劃過程既耗時又耗費計算資源。而且即便如此,也不能保證安全。
該研究的主要作者張鬆源表示:「在無人機表演中,每架無人機都被給定一個特定的軌跡,包括一組路點和時間,然後它們基本上就閉著眼遵循計劃飛行。由於它們只知道自己在什麼時間要到達哪裡,如果發生意外情況,它們就不知道如何應變。」
麻省理工學院的團隊轉而開發一種方法,訓練少量智慧體安全地進行機動操作,並能有效地擴充套件到系統中任意數量的智慧體。而且,這種方法不是為個別智慧體規劃特定路徑,而是讓智慧體能夠不斷繪製自己的安全邊界,也就是超出這個邊界它們可能就不安全了。只要在安全邊界之內,智慧體就可以採取任意路徑來完成任務。
該團隊表示,從某種意義上說,這種方法類似於人類直覺地在周圍環境中導航。Oswin So 解釋道:「比如你在一個非常擁擠的購物商場裡,為了安全地四處走動且不撞到任何人,你只會在意周圍 5 公尺內的人,而不會關心更遠的人。我們的研究採取了類似的區域性方法。」
在他們的新研究中,團隊提出了名為 GCBF+ 的方法,即「圖形控制障礙函式」。障礙函式是機器人學中使用的一個數學術語,用於計算一種安全障礙,也就是智慧體超出這個邊界就很可能不安全。對於任何給定的智慧體,隨著它在系統中其他也在移動的智慧體之間移動,這個安全區域可能時刻都在變化。
在多智慧體系統中,設計師在計算任何一個智慧體的障礙函式時,通常必須考慮它與系統中其他所有智慧體的潛在路徑和相互作用。而麻省理工學院團隊的方法只計算少量智慧體的安全區域,其精確程度足以代表系統中更多智慧體的動態。
Oswin So 說:「然後我們可以把這個障礙函式複製貼上到每一個智慧體上,這樣一來,我們就有了一個適用於系統中任意數量智慧體的安全區域圖。」
為了計算智慧體的障礙函式,該團隊的方法首先考慮智慧體的「感知半徑」,也就是根據其感測器能力,智慧體能夠觀察到的周圍環境範圍。就像在購物商場的類比中一樣,研究人員假設,為了保障安全並避免與其他智慧體碰撞,該智慧體只會在意其感知半徑內的智慧體。
然後,利用捕捉智慧體特定機械能力和限制的電腦模型,團隊模擬出一個「控制器」,也就是一套關於該智慧體和少數類似智慧體應該如何移動的指令。接著,他們對多個智慧體沿特定軌跡移動進行模擬,並記錄它們是否發生碰撞以及如何相互作用。
張鬆源說:「一旦我們有了這些軌跡,就可以計算出一些我們想要最小化的規則,比如在當前控制器下發生了多少次安全違規。然後我們更新控制器,使其更安全。」
透過這種方式,可以將控制器程式設計到實際的智慧體中,使它們能夠根據在周圍環境中感知到的其他智慧體,不斷繪製自己的安全區域,然後在這個安全區域內移動以完成任務。
範楚楚表示:「我們的控制器是反應式的。我們不會事先規劃路徑。我們的控制器會不斷接收有關智慧體去向、速度以及其他無人機飛行速度等資訊。它利用所有這些資訊即時制定計劃,並且每次都重新規劃。所以,如果情況發生變化,它總能做出調整以保障安全。」
該團隊在一個由八架 Crazyflies 無人機組成的系統上演示了 GCBF+ 方法。Crazyflies 是輕型、手掌大小的四旋翼無人機,團隊要求它們在空中飛行並切換位置。如果無人機沿最直的路徑飛行,肯定會發生碰撞。但經過該團隊方法的訓練後,無人機能夠即時做出調整,相互繞行,保持在各自的安全區域內,成功在空中切換位置。
同樣地,團隊還要求無人機飛行一段距離後,降落在特定的 Turtlebots 上。Turtlebots 是頂部有殼狀結構的輪式機器人,它們在一個大圓圈內不斷行駛,而 Crazyflies 無人機在降落時能夠避免相互碰撞。
範楚楚預計,這種方法可以應用於任何多智慧體系統以保障其安全,包括無人機表演中的避撞系統、倉庫機器人、自動駕駛車輛和無人機配送系統等。她說:「使用我們的框架,我們只需要告訴無人機它們的目的地,而不需要給出整個無碰撞軌跡,無人機自己就能想出如何無碰撞地到達目的地。」