近年來(lái),無(wú)人機(jī)群在監(jiān)視、搜救、目標(biāo)跟蹤、損傷評(píng)估等領(lǐng)域得到了廣泛的應(yīng)用。無(wú)人機(jī)群由眾多小型無(wú)人機(jī)組成,有望提供高度合作和智能化的作戰(zhàn)。近十年來(lái),人工智能的迅速發(fā)展為無(wú)人機(jī)群的智能協(xié)作提供了新的方法。然而,小型無(wú)人機(jī)有限的計(jì)算和存儲(chǔ)能力已經(jīng)不能滿足資源密集型人工智能算法的要求。這成為制約無(wú)人機(jī)群智能化發(fā)展的瓶頸。
幸運(yùn)的是,數(shù)字孿生(DT)作為用虛擬表示反映物理實(shí)體的關(guān)鍵技術(shù)之一,提供了最有前途的解決方案。在DT中,基于專家知識(shí)、物理模型、物理空間的歷史和實(shí)時(shí)傳感器數(shù)據(jù),建立了高保真虛擬模型。網(wǎng)絡(luò)空間整合了物理空間的多維數(shù)據(jù),并進(jìn)行建模和分析。DT為網(wǎng)絡(luò)物理系統(tǒng)的構(gòu)建提供了一種新的思路和實(shí)現(xiàn)途徑。它構(gòu)建了網(wǎng)絡(luò)空間中物理實(shí)體的高保真數(shù)字孿生模型,并采用人工智能技術(shù)進(jìn)行數(shù)據(jù)處理以獲得全局最優(yōu)解。我們將重點(diǎn)回答以下問(wèn)題:
Q1:如何以高保真的方式有效地反映虛擬空間中的物理實(shí)體?
Q2:如何充分利用DT在無(wú)人機(jī)群智能協(xié)同中的優(yōu)勢(shì)?
Q3:如何為無(wú)人機(jī)群體設(shè)計(jì)合適的機(jī)器學(xué)習(xí)決策模型?
本文提出了一種基于DT的智能協(xié)作框架,以方便無(wú)人機(jī)群資源密集算法的實(shí)現(xiàn)。如圖1所示,無(wú)人機(jī)群用于不同任務(wù),如森林防火、交通管制、人群監(jiān)控等。在智能中心(IC)建立了一個(gè)數(shù)字雙模型,用于反映和監(jiān)控物理實(shí)體(即無(wú)人機(jī)群)的整個(gè)生命周期。集成電路與高性能單元相結(jié)合,利用機(jī)器學(xué)習(xí)算法,在決策模型中探索了無(wú)人機(jī)群智能協(xié)作的全局最優(yōu)解。
圖1 基于數(shù)字孿生的無(wú)人機(jī)群智能協(xié)作框架綜述
為了支持無(wú)人機(jī)群的智能協(xié)作,實(shí)時(shí)提供最優(yōu)決策,提出了一種基于數(shù)字孿生的智能協(xié)作框架。無(wú)人機(jī)群的協(xié)同控制是一個(gè)復(fù)雜的問(wèn)題,目標(biāo)定位問(wèn)題是NP難問(wèn)題。機(jī)器學(xué)習(xí)算法可以提供高效的解決方案,但需要很高的計(jì)算和存儲(chǔ)能力。這些算法不能直接應(yīng)用于小型無(wú)人機(jī)。在這項(xiàng)工作中,我們介紹了一種新的基于數(shù)字孿生的智能協(xié)作框架,如圖2所示。一般來(lái)說(shuō),框架由四部分組成:構(gòu)成框架基礎(chǔ)的物理實(shí)體;監(jiān)控物理空間的數(shù)字模型;做出智能合作決策的決策模型;以及連接所有部分的連接。這四個(gè)部分相互協(xié)作,實(shí)時(shí)提供最佳決策。
圖2 基于數(shù)字孿生的無(wú)人機(jī)群智能協(xié)同工作流程
如圖2所示,在決策模型中訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)(DNN)以提供最優(yōu)策略。無(wú)人機(jī)群在每一時(shí)刻的狀態(tài)都是由位置、速度、能量、探測(cè)概率等特征決定的。首先,數(shù)字模型從物理實(shí)體獲取環(huán)境狀態(tài)信息,通過(guò)仿真和建模生成不同任務(wù)的樣本數(shù)據(jù)集。在樣本數(shù)據(jù)集中有足夠的數(shù)據(jù),我們訓(xùn)練了DNN模型。一旦訓(xùn)練,數(shù)字模型收集實(shí)時(shí)狀態(tài)信息并抽象當(dāng)前狀態(tài)的特征。利用這些輸入,DNN進(jìn)行最優(yōu)預(yù)測(cè)并輸出到數(shù)字模型。接下來(lái),數(shù)字模型分發(fā)最終決策以指導(dǎo)物理實(shí)體。最后,將不同時(shí)刻的狀態(tài)信息和環(huán)境反饋收集到樣本集進(jìn)行進(jìn)一步的訓(xùn)練。
在空戰(zhàn)領(lǐng)域,時(shí)變環(huán)境對(duì)網(wǎng)絡(luò)性能提出了特殊的要求,如低延遲、低帶寬等。構(gòu)建高度柔性作戰(zhàn)單元及其相應(yīng)武器系統(tǒng)之間的自組織網(wǎng)絡(luò)具有重要意義。然而,受環(huán)境變化頻繁的影響,在執(zhí)行不同的作戰(zhàn)任務(wù)時(shí),固定的網(wǎng)絡(luò)模式很難甚至不可能支持協(xié)同數(shù)據(jù)傳輸。
我們?yōu)闀r(shí)變戰(zhàn)場(chǎng)提出了一種任務(wù)驅(qū)動(dòng)型智能網(wǎng)絡(luò)重建平臺(tái)。該平臺(tái)將任務(wù)分為具有不同特征的幾種類型,并據(jù)此設(shè)計(jì)網(wǎng)絡(luò)模式。在數(shù)字模型中,根據(jù)任務(wù)要求和在各種環(huán)境條件下的仿真結(jié)果,構(gòu)建經(jīng)驗(yàn)數(shù)據(jù)集。對(duì)于特定任務(wù),可以使用機(jī)器學(xué)習(xí)算法獲得最佳網(wǎng)絡(luò)模式,包括介質(zhì)訪問(wèn)控制(MAC),資源分配,數(shù)據(jù)路由和拓?fù)淇刂撇呗。然后,將決策釋放到數(shù)據(jù)平面以用于物理實(shí)體的資源分配。執(zhí)行戰(zhàn)斗任務(wù)后,將分析網(wǎng)絡(luò)性能并將其反饋給數(shù)字模型以更新樣本數(shù)據(jù)集。
該智能協(xié)同框架可廣泛應(yīng)用于彈道設(shè)計(jì)、協(xié)同搜索、協(xié)同任務(wù)分配、協(xié)同編隊(duì)控制等領(lǐng)域。下面,我們將介紹一個(gè)最具代表性的應(yīng)用程序,即圖3所示的協(xié)作搜索,以了解我們框架的好處。
圖3 基于數(shù)字孿生的無(wú)人機(jī)群智能協(xié)同搜索
為了提供覆蓋搜索區(qū)域的最優(yōu)路徑規(guī)劃,協(xié)同搜索算法需要在無(wú)人機(jī)群中進(jìn)行適當(dāng)?shù)脑诰資源分配。傳統(tǒng)的分布式協(xié)同搜索策略依賴于局部狀態(tài)信息,局部狀態(tài)信息具有魯棒性,但往往是局部最優(yōu)的。此外,隨著無(wú)人機(jī)數(shù)量的增加,協(xié)同搜索的難度呈幾何級(jí)數(shù)增加。由于無(wú)人機(jī)的能量和計(jì)算量大,傳統(tǒng)的算法無(wú)法提供最優(yōu)策略。基于數(shù)字孿生模型的智能協(xié)作框架有效地將資源密集型操作轉(zhuǎn)化為虛擬模型,為協(xié)作搜索提供了最優(yōu)的解決方案。