[發明專利]模型的訓練方法和裝置、計算機設備、存儲介質在審
| 申請號: | 202210057007.1 | 申請日: | 2022-01-18 |
| 公開(公告)號: | CN114386528A | 公開(公告)日: | 2022-04-22 |
| 發明(設計)人: | 趙越;徐卓揚 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F40/35;G06F40/289;G06N3/04;G06N3/08;G16H20/10 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 麥廣林 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 訓練 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種模型的訓練方法,其特征在于,用于訓練處方推薦模型,包括:
獲取問診樣本數據和所述問診樣本數據的處方樣本數據;其中,每一所述問診樣本數據包括患者樣本數據和對話樣本數據,每一所述處方樣本數據包括多個藥物樣本數據;
通過預訓練模型對所述患者樣本數據和所述對話樣本數據進行預測處理,得到處方預測數據;其中,所述處方預測數據包括多個藥物預測數據;
根據所述多個藥物預測數據對所述預訓練模型的第一損失函數進行計算,得到第一損失值;
根據所述多個藥物樣本數據構建藥物共現矩陣;
根據所述藥物共現矩陣對所述預訓練模型的第二損失函數進行計算,得到第二損失值;
根據所述第一損失值和所述第二損失值對所述預訓練模型進行訓練處理,得到處方推薦模型;其中,所述處方推薦模型用于處方的推薦。
2.根據權利要求1所述的方法,其特征在于,所述通過預訓練模型對所述患者樣本數據和所述對話樣本數據進行預測處理,得到處方預測數據,包括:
根據預設的數據格式對所述患者樣本數據進行標準化處理,得到對應的患者特征;
對所述患者特征進行第一編碼處理,得到對應的患者向量;
對所述對話樣本數據進行第二編碼處理,得到對應的對話向量;
根據所述患者向量和所述對話向量,進行預測處理,得到處方預測數據。
3.根據權利要求2所述的方法,其特征在于,所述對所述對話樣本數據進行第二編碼處理,得到對應的對話向量,包括:
獲取預設的層次注意模型;其中,所述層次注意模型包括詞層次神經網絡和句層次神經網絡;
對所述對話樣本數據進行分詞處理,得到分詞數據;
對所述分詞數據進行編碼處理,得到詞編碼向量;
通過所述詞層次神經網絡對所述詞編碼向量進行編碼處理,得到句編碼向量;
通過所述句層次神經網絡對所述句編碼向量進行編碼處理,得到對話向量。
4.根據權利要求2所述的方法,其特征在于,每一所述藥物樣本數據包括多種預設藥物;所述根據所述患者向量和所述對話向量,進行預測處理,得到處方預測數據,包括:
對所述患者向量和所述對話向量進行拼接處理,得到拼接向量;
通過全連接層對所述拼接向量進行預測處理,得到每一所述預設藥物的開具概率;
根據預設閾值和所述開具概率,對所述預設藥物進行篩選處理,得到目標藥物;
將所述目標藥物作為所述處方預測數據。
5.根據權利要求4所述的方法,其特征在于,所述根據所述多個藥物樣本數據構建藥物共現矩陣,包括:
獲取所述藥物樣本數據中所述預設藥物之間的共現關系,得到藥物共現關系;
基于所述藥物共現關系構建所述預設藥物的藥物共現對,并獲取對應的藥物共現次數;
對所述藥物共現次數進行歸一化處理,得到第一共現值;
計算所述第一共現值和所述預設閾值之差,得到第二共現值;
根據所述第二共現值構建藥物共現矩陣。
6.根據權利要求1所述的方法,其特征在于,所述根據所述第一損失值和所述第二損失值對所述預訓練模型進行訓練處理,得到處方推薦模型,包括:
將所述第一損失值和所述第二損失值作為反向傳播量,調整所述預訓練模型的模型參數,以訓練所述預訓練模型,得到所述處方推薦模型。
7.根據權利要求1-6任一項所述的方法,其特征在于,還包括:
獲取實際問診數據;其中,所述實際問診數據包括實際患者數據和實際對話數據;
將所述實際患者數據和所述實際對話數據輸入至所述處方推薦模型進行處方推薦處理,得到推薦處方。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210057007.1/1.html,轉載請聲明來源鉆瓜專利網。





