基于數(shù)字孿生的無人機(jī)群智能協(xié)作框架

來源：無人機(jī)網(wǎng)　更新日期：2021-11-16 作者：飛思實(shí)驗(yàn)室

商顯市場(chǎng)最大的看點(diǎn)何在年度評(píng)選盛典獲獎(jiǎng)揭曉 Infocomm China 深入報(bào)道

近年來，無人機(jī)群在監(jiān)視、搜救、目標(biāo)跟蹤、損傷評(píng)估等領(lǐng)域得到了廣泛的應(yīng)用。無人機(jī)群由眾多小型無人機(jī)組成，有望提供高度合作和智能化的作戰(zhàn)。近十年來，人工智能的迅速發(fā)展為無人機(jī)群的智能協(xié)作提供了新的方法。然而，小型無人機(jī)有限的計(jì)算和存儲(chǔ)能力已經(jīng)不能滿足資源密集型人工智能算法的要求。這成為制約無人機(jī)群智能化發(fā)展的瓶頸。

幸運(yùn)的是，數(shù)字孿生（DT）作為用虛擬表示反映物理實(shí)體的關(guān)鍵技術(shù)之一，提供了最有前途的解決方案。在DT中，基于專家知識(shí)、物理模型、物理空間的歷史和實(shí)時(shí)傳感器數(shù)據(jù)，建立了高保真虛擬模型。網(wǎng)絡(luò)空間整合了物理空間的多維數(shù)據(jù)，并進(jìn)行建模和分析。DT為網(wǎng)絡(luò)物理系統(tǒng)的構(gòu)建提供了一種新的思路和實(shí)現(xiàn)途徑。它構(gòu)建了網(wǎng)絡(luò)空間中物理實(shí)體的高保真數(shù)字孿生模型，并采用人工智能技術(shù)進(jìn)行數(shù)據(jù)處理以獲得全局最優(yōu)解。我們將重點(diǎn)回答以下問題：

Q1:如何以高保真的方式有效地反映虛擬空間中的物理實(shí)體？

Q2:如何充分利用DT在無人機(jī)群智能協(xié)同中的優(yōu)勢(shì)？

Q3:如何為無人機(jī)群體設(shè)計(jì)合適的機(jī)器學(xué)習(xí)決策模型？

本文提出了一種基于DT的智能協(xié)作框架，以方便無人機(jī)群資源密集算法的實(shí)現(xiàn)。如圖1所示，無人機(jī)群用于不同任務(wù)，如森林防火、交通管制、人群監(jiān)控等。在智能中心（IC）建立了一個(gè)數(shù)字雙模型，用于反映和監(jiān)控物理實(shí)體（即無人機(jī)群）的整個(gè)生命周期。集成電路與高性能單元相結(jié)合，利用機(jī)器學(xué)習(xí)算法，在決策模型中探索了無人機(jī)群智能協(xié)作的全局最優(yōu)解。

圖1 基于數(shù)字孿生的無人機(jī)群智能協(xié)作框架綜述

為了支持無人機(jī)群的智能協(xié)作，實(shí)時(shí)提供最優(yōu)決策，提出了一種基于數(shù)字孿生的智能協(xié)作框架。無人機(jī)群的協(xié)同控制是一個(gè)復(fù)雜的問題，目標(biāo)定位問題是NP難問題。機(jī)器學(xué)習(xí)算法可以提供高效的解決方案，但需要很高的計(jì)算和存儲(chǔ)能力。這些算法不能直接應(yīng)用于小型無人機(jī)。在這項(xiàng)工作中，我們介紹了一種新的基于數(shù)字孿生的智能協(xié)作框架，如圖2所示。一般來說，框架由四部分組成：構(gòu)成框架基礎(chǔ)的物理實(shí)體；監(jiān)控物理空間的數(shù)字模型；做出智能合作決策的決策模型；以及連接所有部分的連接。這四個(gè)部分相互協(xié)作，實(shí)時(shí)提供最佳決策。

圖2 基于數(shù)字孿生的無人機(jī)群智能協(xié)同工作流程

如圖2所示，在決策模型中訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)（DNN）以提供最優(yōu)策略。無人機(jī)群在每一時(shí)刻的狀態(tài)都是由位置、速度、能量、探測(cè)概率等特征決定的。首先，數(shù)字模型從物理實(shí)體獲取環(huán)境狀態(tài)信息，通過仿真和建模生成不同任務(wù)的樣本數(shù)據(jù)集。在樣本數(shù)據(jù)集中有足夠的數(shù)據(jù)，我們訓(xùn)練了DNN模型。一旦訓(xùn)練，數(shù)字模型收集實(shí)時(shí)狀態(tài)信息并抽象當(dāng)前狀態(tài)的特征。利用這些輸入，DNN進(jìn)行最優(yōu)預(yù)測(cè)并輸出到數(shù)字模型。接下來，數(shù)字模型分發(fā)最終決策以指導(dǎo)物理實(shí)體。最后，將不同時(shí)刻的狀態(tài)信息和環(huán)境反饋收集到樣本集進(jìn)行進(jìn)一步的訓(xùn)練。

在空戰(zhàn)領(lǐng)域，時(shí)變環(huán)境對(duì)網(wǎng)絡(luò)性能提出了特殊的要求，如低延遲、低帶寬等。構(gòu)建高度柔性作戰(zhàn)單元及其相應(yīng)武器系統(tǒng)之間的自組織網(wǎng)絡(luò)具有重要意義。然而，受環(huán)境變化頻繁的影響，在執(zhí)行不同的作戰(zhàn)任務(wù)時(shí)，固定的網(wǎng)絡(luò)模式很難甚至不可能支持協(xié)同數(shù)據(jù)傳輸。

我們?yōu)闀r(shí)變戰(zhàn)場(chǎng)提出了一種任務(wù)驅(qū)動(dòng)型智能網(wǎng)絡(luò)重建平臺(tái)。該平臺(tái)將任務(wù)分為具有不同特征的幾種類型，并據(jù)此設(shè)計(jì)網(wǎng)絡(luò)模式。在數(shù)字模型中，根據(jù)任務(wù)要求和在各種環(huán)境條件下的仿真結(jié)果，構(gòu)建經(jīng)驗(yàn)數(shù)據(jù)集。對(duì)于特定任務(wù)，可以使用機(jī)器學(xué)習(xí)算法獲得最佳網(wǎng)絡(luò)模式，包括介質(zhì)訪問控制（MAC），資源分配，數(shù)據(jù)路由和拓?fù)淇刂撇呗�。然后，將決策釋放到數(shù)據(jù)平面以用于物理實(shí)體的資源分配。執(zhí)行戰(zhàn)斗任務(wù)后，將分析網(wǎng)絡(luò)性能并將其反饋給數(shù)字模型以更新樣本數(shù)據(jù)集。

該智能協(xié)同框架可廣泛應(yīng)用于彈道設(shè)計(jì)、協(xié)同搜索、協(xié)同任務(wù)分配、協(xié)同編隊(duì)控制等領(lǐng)域。下面，我們將介紹一個(gè)最具代表性的應(yīng)用程序，即圖3所示的協(xié)作搜索，以了解我們框架的好處。

圖3 基于數(shù)字孿生的無人機(jī)群智能協(xié)同搜索

為了提供覆蓋搜索區(qū)域的最優(yōu)路徑規(guī)劃，協(xié)同搜索算法需要在無人機(jī)群中進(jìn)行適當(dāng)?shù)脑诰€資源分配。傳統(tǒng)的分布式協(xié)同搜索策略依賴于局部狀態(tài)信息，局部狀態(tài)信息具有魯棒性，但往往是局部最優(yōu)的。此外，隨著無人機(jī)數(shù)量的增加，協(xié)同搜索的難度呈幾何級(jí)數(shù)增加。由于無人機(jī)的能量和計(jì)算量大，傳統(tǒng)的算法無法提供最優(yōu)策略�；跀�(shù)字孿生模型的智能協(xié)作框架有效地將資源密集型操作轉(zhuǎn)化為虛擬模型，為協(xié)作搜索提供了最優(yōu)的解決方案。

返回VR虛擬現(xiàn)實(shí)視頻道首頁