[發明專利]智能體信息交互對象確定方法、系統、電子設備及介質在審
| 申請號: | 202310707964.9 | 申請日: | 2023-06-14 |
| 公開(公告)號: | CN116628359A | 公開(公告)日: | 2023-08-22 |
| 發明(設計)人: | 謝少榮;張瀚;駱祥峰;王欣芝 | 申請(專利權)人: | 上海大學 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G06N3/092;G06F16/9537 |
| 代理公司: | 北京高沃律師事務所 11569 | 代理人: | 王愛濤 |
| 地址: | 200444*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 智能 信息 交互 對象 確定 方法 系統 電子設備 介質 | ||
本發明公開一種智能體信息交互對象確定方法、系統、電子設備及介質,通過獲取當前協作場景中目標智能體的自身觀測信息和當前非目標智能體的位置信息;根據目標智能體的自身觀測信息和當前非目標智能體的位置信息,利用交互偏好網絡,對目標智能體與非目標智能體的交互概率和目標智能體與當前非目標智能體的不交互概率進行預測;根據交互概率和所述不交互概率,確定目標智能體的交互對象。其中,使用了KL散度實現智能體之間交互偏好的度量,利用交互偏好值確定出的訓練樣本集對交互偏好網絡進行訓練,確定交互偏好網絡。本發明提高了多智能體間信息交互的效率。
技術領域
本發明涉及智能體信息交互領域,特別是涉及一種智能體信息交互對象確定方法、系統、電子設備及介質。
背景技術
多智能體信息交互對于現實世界中分布式多智能體系統之間的協作至關重要,例如自動駕駛汽車規劃、交通信號燈控制和多機器人控制等。尤其是在不完全可觀測的環境中,智能體由于傳感器探測范圍有限以及傳感數據噪聲等問題,只能對局部場景進行感知與理解。多智能體之間的信息交互可以通過信息的共享,為智能體提供近似全局的視野,提高智能體對集群任務執行情況的了解,促進協作行為的產生。
現有的多智能體信息交互方法,通過構建通信神經網絡、雙向協調網絡、意圖共享方案等將自身的局部觀測信息進行表征,然后廣播給所有其他隊友智能體。為了形成自適應的交互過程,TarMAC方法引入基于簽名的注意力機制,使智能體在交互信息融合過程中更加關注與自身更相關的信息,但仍然是一種全交互機制,使智能體能夠忽略接收到的不相關消息。大多數的多智能體信息交互方法,需要在所有智能體之間進行信息共享,使得每個智能體難以區分,交互信息中有助于協作決策的有價值信息和阻礙協作決策的冗余信息,加大了信息篩選與融合的難度,難以高效提升智能體間的協作,甚至會阻礙協作策略的學習過程。此外,在現實世界的應用中,廣播交互需要大量信息傳遞,對通信帶寬依賴高,在弱通信條件下容易形成信息傳遞的阻塞,造成信息滯后、丟失等問題,加劇了協作策略學習的復雜性。
綜上,當前的多智能體交互方法,主要采用觀測信息表征與廣播傳遞的交互機制在智能體之間進行信息共享,沒有考慮不同場景狀態下,各個交互對象對自身的交互價值是不同的,存在交互過程缺乏針對性,大量交互信息傳遞對通信帶寬依賴高,所需通信開銷大的問題。因此,形成具有針對性的信息交互過程,能夠根據不同的協作狀態,動態選擇有價值的部分交互對象進行信息共享,以提升智能體之間交互與協作的效率是非常重要的。
發明內容
本發明的目的是提供一種智能體信息交互對象確定方法、系統、電子設備及介質,以提高多智能體之間信息交互的效率。
為實現上述目的,本發明提供了如下方案:
一種智能體信息交互對象確定方法,包括:
獲取協作場景中目標智能體的自身觀測信息和當前非目標智能體的位置信息;所述協作場景內設置有多個智能體、多個動態目標和多個靜態障礙物;所述自身觀測信息包括目標智能體的速度信息、目標智能體的位置信息、目標智能體局部感知范圍內靜態障礙物的位置信息和目標智能體局部感知范圍內動態目標的位置信息;
根據所述目標智能體的自身觀測信息和所述當前非目標智能體的位置信息,利用交互偏好網絡,預測所述目標智能體與所述非目標智能體的交互概率和所述目標智能體與所述當前非目標智能體的不交互概率;其中,所述交互偏好網絡是利用訓練樣本集對交互偏好初始網絡進行訓練確定的;所述訓練樣本集包括多個具有交互標簽的訓練樣本;所述訓練樣本包括目標智能體樣本的自身觀測信息和一個非目標智能體樣本的位置信息;所述交互標簽為1或0;1為選擇所述當前非目標智能體樣本作為所述目標智能體樣本的交互對象;0為不選擇所述當前非目標智能體樣本作為所述目標智能體樣本的交互對象;所述交互偏好初始網絡包括依次連接的第一全連接層、第二全連接層、第三全連接層和softmax層;
根據所述交互概率和所述不交互概率,確定所述目標智能體的交互對象。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海大學,未經上海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310707964.9/2.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





