[發明專利]一種模型訓練方法及命名實體識別方法有效
| 申請號: | 201810685795.2 | 申請日: | 2018-06-28 |
| 公開(公告)號: | CN110728147B | 公開(公告)日: | 2023-04-28 |
| 發明(設計)人: | 王宗宇;王濤;李林琳;司羅 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G06F16/28;G06Q30/0601 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 李輝 |
| 地址: | 英屬開曼*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 模型 訓練 方法 命名 實體 識別 | ||
1.一種模型訓練方法,其特征在于,所述方法包括:
利用多個第一歷史產品描述信息與所述第一歷史產品描述信息對應的品類信息之間的對應關系訓練得到第一深度學習模型組件,所述品類信息被設置為利用機器學習模型組件預測得到;
基于所述第一深度學習模型組件,利用人工標注的樣本數據訓練得到第二深度學習模型組件;
分別利用所述第一深度學習模型組件和所述第二深度學習模型組件生成多個訓練數據,并利用所述多個訓練數據訓練生成第三深度學習模型組件,所述第三深度學習模型組件用于識別產品描述信息中的品類信息。
2.根據權利要求1所述的方法,其特征在于,所述第一深度學習模型組件、所述第二深度學習模型組件、所述第三深度學習模型組件包括雙向長短期記憶網絡及條件隨機場模型組件。
3.根據權利要求1所述的方法,其特征在于,所述利用多個第一歷史產品描述信息與所述第一歷史產品描述信息對應的品類信息之間的對應關系訓練得到所述第一深度學習模型組件包括:
獲取多個第一歷史產品描述信息;
利用機器學習模型組件分別預測所述多個第一歷史產品描述信息對應的品類信息;
構建第一深度學習模型組件,所述第一深度學習模型組件中設置有第一訓練參數;
分別利用所述多個第一歷史產品描述信息以及所述品類信息之間的對應關系對所述第一深度學習模型組件進行訓練,調整所述第一訓練參數,直至所述第一深度學習模型組件達到預設要求。
4.根據權利要求3所述的方法,其特征在于,所述機器學習模型包括條件隨機場CRF模型組件,所述CRF模型組件被設置為按照下述方式訓練得到:
獲取多個第二歷史產品描述信息;
依據品類信息數據集分別確定所述第二歷史產品描述信息中的品類信息;
構建CRF模型組件,所述CRF模型組件中設置有第二訓練參數;
提取所述第二歷史產品描述信息中的特征信息,所述特征信息中包括所述品類信息;
分別利用所述多個第二歷史產品描述信息以及所述特征信息之間的對應關系對所述CRF模型組件進行訓練,調整所述第二訓練參數,直至所述CRF模型組件達到預設要求。
5.根據權利要求4所述的方法,其特征在于,所述品類信息數據集被設置為按照下述方式獲取:
獲取多個產品描述詞,并對所述多個產品描述詞進行分類;
分別計算不同類別的產品描述詞之間的相關性信息;
當所述相關性信息滿足預設要求時,將對應的產品描述詞組合成品類信息,并將所述品類信息添加至品類信息數據集中。
6.根據權利要求5所述的方法,其特征在于,所述相關性信息包括下述中的至少一種:結合度、點互信息、信息熵距離。
7.根據權利要求4所述的方法,其特征在于,所述品類信息還包括下述中的至少一種:品類詞在產品描述信息中的位置、產品描述信息的第一個描述詞、產品描述信息的最后一個描述詞、產品品牌詞、產品詞。
8.根據權利要求1所述的方法,其特征在于,所述分別利用所述第一深度學習模型組件和所述第二深度學習模型組件生成多個訓練數據,并利用所述多個訓練數據訓練生成第三深度學習模型組件包括:
獲取多個第一產品描述信息以及多個第二產品描述信息;
分別將所述第一產品描述信息輸入至所述第一深度學習模型組件中,獲取所述第一產品描述信息對應的第一品類信息;分別將所述第二產品描述信息輸入至所述第二深度學習模型組件中,獲取所述第二產品描述信息對應的第二品類信息;
構建第三深度學習模型組件,所述第三深度學習模型組件中設置有第三訓練參數;
分別利用所述多個第一產品描述信息以及所述第一品類信息、所述多個第二產品描述信息以及所述第二品類信息之間的對應關系對所述第三深度學習模型組件進行訓練,調整所述第三訓練參數,直至所述第三深度學習模型組件達到預設要求。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810685795.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:輿情發現方法、裝置、終端設備以及存儲介質
- 下一篇:實體關系抽取方法和裝置





