[發明專利]一種具有多智能體的神經網絡提升收斂和訓練速度的方法在審
| 申請號: | 202110192255.2 | 申請日: | 2021-02-20 |
| 公開(公告)號: | CN112819144A | 公開(公告)日: | 2021-05-18 |
| 發明(設計)人: | 陳晨 | 申請(專利權)人: | 廈門吉比特網絡技術股份有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08;G06N20/00;A63F13/67 |
| 代理公司: | 廈門市新華專利商標代理有限公司 35203 | 代理人: | 羅恒蘭 |
| 地址: | 361004 福建省*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 具有 智能 神經網絡 提升 收斂 訓練 速度 方法 | ||
1.一種具有多智能體的神經網絡提升收斂和訓練速度的方法,其特征在于:所述方法基于多智能體系統實現,所述多智能體系統包括多智能體總控和N個智能體,每一智能體的反饋中設有埋點,用于判斷智能體的指令是否有誤,是否作出優秀決策;所述方法具體如下:
輸入狀態信息,將當前的狀態信息傳遞給N個智能體;
智能體根據各自的神經網絡,并結合當前的狀態信息,輸出各自的指令;
智能體根據其指令結果,并結合反饋中的埋點判斷,給予智能體的獎懲反饋;
將N個智能體的獎懲匯總成獎懲列表,傳遞給多智能體總控;
多智能體總控根據獎懲列表,反向更新各智能體的神經網絡。
2.一種具有多智能體的神經網絡提升收斂和訓練速度的裝置,其特征在于:所述裝置包括處理器和存儲器;
所述存儲器用于存儲一個或多個軟件程序,所述一個或多個程序包括指令,所述指令當被所述處理器執行時使所述處理器執行權利要求1所述的方法。
3.一種計算機可讀存儲介質,其特征在于:所述機算機可讀存儲介質中存儲有指令,當所述指令在終端設備上運行時,使得所述終端設備執行如權利要求1所述的方法。
4.一種計算機軟件程序產品,其特征在于:所述計算機軟件程序產品在終端設備上運行時,使得所述終端設備執行如權利要求1所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門吉比特網絡技術股份有限公司,未經廈門吉比特網絡技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110192255.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種織物用包裝結構及其包裝方法
- 下一篇:工業品的選型訂購方法





