[發明專利]模型訓練方法、貨物堆放的優化方法、裝置和電子設備在審
| 申請號: | 202211012375.0 | 申請日: | 2022-08-23 |
| 公開(公告)號: | CN115470971A | 公開(公告)日: | 2022-12-13 |
| 發明(設計)人: | 曹宜超;丁建輝;陳珍 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q10/08;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京銀龍知識產權代理有限公司 11243 | 代理人: | 張圣孝 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 訓練 方法 貨物 堆放 優化 裝置 電子設備 | ||
1.一種模型訓練方法,包括:
獲取k個訓練數據組,所述k個訓練數據組為按照k個分類類別對訓練數據集中的初始訓練數據進行分類得到的k個訓練數據組,所述k個分類類別與k種貨物堆放優化函數的函數類別相對應,所述k為大于1的整數;
基于所述k個訓練數據組,分別對k個預先構建的神經網絡模型進行訓練,得到k個目標神經網絡模型,其中,所述k個訓練數據組與所述k個目標神經網絡模型一一對應,所述目標神經網絡模型為基于所對應的訓練數據組進行訓練得到的模型,且在對所述貨物堆放優化函數進行混合整數規劃的過程中,所述目標神經網絡模型用于預測決策變量。
2.根據權利要求1所述的方法,其中,所述獲取k個訓練數據組,包括:
獲取所述訓練數據集,所述訓練數據集包括多個初始訓練數據,所述初始訓練數據包括所對應的貨物堆放優化函數的函數信息;
基于所述函數信息對應的目標參數對所述多個初始訓練數據進行分類,得到所述k個訓練數據組;
其中,所述目標參數包括以下參數中的至少一項:整數變量占總變量的比例、連續變量占總變量的比例、隱整數變量占總變量的比例、二進制變量占總變量的比例、不等式約束個數占總約束個數的比例、變量總個數和約束總個數。
3.根據權利要求1所述的方法,其中,所述基于所述k個訓練數據組,分別對k個預先構建的神經網絡模型進行訓練,得到k個目標神經網絡模型,包括:
基于混合整數規劃求解器,利用第一訓練數據組中的第一初始訓練數據,對第一神經網絡模型進行n次迭代訓練,得到第一目標神經網絡模型,所述n為大于1的整數;
其中,所述第一訓練數據組為所述k個訓練數據組中的任意一個訓練數據組,所述第一目標神經網絡模型為所述k個目標神經網絡模型中與所述第一訓練數據組相對應的目標神經網絡模型;
所述第一神經網絡模型用于對所接收到的第一函數信息進行混合整數規劃的過程中,確定求解樹的各節點的決策變量;所述第一初始訓練數據包括所述第一函數信息和求解樹中各分支節點對應的目標決策變量的標簽數據,所述第一函數信息包括:以在第一貨倉中堆放的第一貨物的數量最多為優化目標確定的函數信息。
4.根據權利要求3所述的方法,其中,所述n次迭代訓練中的第s次訓練包括:
將第s個訓練數據輸入第s個神經網絡模型,得到所述第s個神經網絡模型輸出的第s個決策變量,所述第s個決策變量為與所述求解樹中的第s個節點相對應的決策變量;
將所述第s個訓練數據和所述第s個決策變量輸入所述混合整數規劃求解器進行預測,得到預測結果;
基于所述預測結果與理論結果生成第s個回報值;
基于所述第s個回報值對所述第s個神經網絡模型進行更新,得到第s+1個神經網絡模型;
在所述s等于1的情況下,所述第s個訓練數據為所述第一初始訓練數據,所述第s個神經網絡模型為所述第一神經網絡模型;
在所述s不等于1的情況下,所述第s個訓練數據為基于第s-1個神經網絡模型輸出的決策變量對第s-1個訓練數據進行更新之后得到的訓練數據。
5.根據權利要求4所述的方法,其中,所述基于所述第s個回報值對所述第s個神經網絡模型進行更新,得到第s+1個神經網絡模型,包括:
基于目標回報值對所述第s個神經網絡模型進行更新,得到第s+1個神經網絡模型;
其中,在所述第s個回報值小于或等于第一閾值的情況下,所述目標回報值為基于第一縮放函數對所述第s個回報值進行放大之后,得到的回報值;
在所述s大于所述第一閾值,且所述s小于第二閾值的情況下,所述目標回報值為所述第s個回報值;
在所述第s個回報值大于或等于所述第二閾值的情況下,所述目標回報值為基于第二縮放函數對所述第s個回報值進行縮小之后,得到的回報值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211012375.0/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





