[發明專利]一種基于光子神經網絡的路徑規劃設備及路徑規劃方法有效
| 申請號: | 202110495811.3 | 申請日: | 2021-05-07 |
| 公開(公告)號: | CN113110493B | 公開(公告)日: | 2022-09-30 |
| 發明(設計)人: | 張天;胡富榮;楊志偉;趙婉玉;戴鍵;徐坤 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | G05D1/02 | 分類號: | G05D1/02 |
| 代理公司: | 北京柏杉松知識產權代理事務所(普通合伙) 11413 | 代理人: | 丁蕓;趙元 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 光子 神經網絡 路徑 規劃 設備 方法 | ||
1.一種基于光子神經網絡的路徑規劃設備,其特征在于,所述設備包括:
判決模塊、臨時存儲器以及光子神經網絡模塊,所述臨時存儲器分別與所述判決模塊和所述光子神經網絡模塊連接,所述判決模塊還與所述光子神經網絡模塊連接;
所述判決模塊,用于獲取待規劃路徑的場景中的歷史狀態信息,并基于所述歷史狀態信息,確定對應的歷史操作信息,其中,所述歷史狀態信息包括:所述路徑規劃設備的歷史位置信息、歷史目標位置信息、歷史障礙物位置信息,所述歷史操作信息為對所述路徑規劃設備進行移動的操作;
所述臨時存儲器,用于獲取基于所述待規劃路徑的場景對所述歷史操作信息作出的歷史獎勵值,并基于所述歷史操作信息以及對應的歷史獎勵值,確定所述歷史操作信息對應的歷史操作價值;
所述光子神經網絡模塊,用于獲取多個所述歷史操作信息以及對應的多個歷史操作價值,并基于多個所述歷史操作信息和對應的多個所述歷史操作價值,對光子神經網絡模型進行訓練,得到訓練完成的光子神經網絡模型;
所述光子神經網絡模塊,還用于獲取所述待規劃路徑的場景中的當前狀態信息,并將所述當前狀態信息輸入至所述訓練完成的光子神經網絡模型中,得到所述訓練完成的光子神經網絡模型輸出的所述路徑規劃設備的路徑規劃信息;
所述判決模塊,具體用于:基于所述歷史狀態信息、隨機判決概率與對應的衰減系數,確定對應的歷史操作信息;
所述判決模塊,具體用于:
基于所述隨機判決概率對應的衰減系數對所述隨機判決概率進行衰減;
在衰減后的隨機判決概率大于預設閾值時,隨機選擇與所述歷史狀態信息對應的歷史操作信息;
在所述衰減后的隨機判決概率小于或等于所述預設閾值時,獲取所述光子神經網絡模型基于所述歷史狀態信息輸出的不同操作信息對應的第一預測操作價值;并在所述不同操作信息中,選擇最大的第一預測操作價值對應的操作信息作為所述歷史狀態信息對應的歷史操作信息。
2.根據權利要求1所述的設備,其特征在于,所述光子神經網絡模型為基于馬赫-曾德爾干涉儀的多層光子神經網絡;
所述光子神經網絡模塊,具體用于將所述多個歷史操作信息對應的光信號輸入至所述多層光子神經網絡,得到所述多層光子神經網絡基于所述多個歷史操作信息輸出的第二預測操作價值;
所述光子神經網絡模塊,還用于基于所述第二預測操作價值和多個所述歷史操作信息對應的多個所述歷史操作價值,調整所述光子神經網絡的權值,以對所述光子神經網絡模型進行訓練,并得到訓練完成的光子神經網絡模型。
3.根據權利要求1所述的設備,其特征在于,所述臨時存儲器,還用于存儲所述歷史操作信息以及對應的歷史操作價值;
所述光子神經網絡模塊,具體用于獲取所述臨時存儲器中存儲的多個所述歷史操作信息以及對應的多個歷史操作價值,并基于多個所述歷史操作信息和對應的多個所述歷史操作價值,對光子神經網絡模型進行訓練,得到訓練完成的光子神經網絡模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110495811.3/1.html,轉載請聲明來源鉆瓜專利網。





