[發明專利]信息識別方法、裝置、計算機系統及可讀存儲介質在審
| 申請號: | 202110186799.8 | 申請日: | 2021-02-10 |
| 公開(公告)號: | CN113779240A | 公開(公告)日: | 2021-12-10 |
| 發明(設計)人: | 周彬 | 申請(專利權)人: | 北京沃東天駿信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 孫蕾 |
| 地址: | 100176 北京市大興區北京經濟*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息 識別 方法 裝置 計算機系統 可讀 存儲 介質 | ||
1.一種文本信息識別模型的訓練方法,包括:
獲取訓練樣本數據集,其中,所述訓練樣本數據集中的訓練樣本包括文本信息及每個文本信息對應的初始類別標簽,其中,所述文本信息至少包括目標關鍵詞,所述初始類別標簽用于表征所述文本信息為違規信息或者合規信息;
構建初始文本信息識別模型,其中,所述初始文本信息識別模型包括空洞卷積網絡模塊和雙向長短期記憶網絡模塊;以及
基于所述訓練樣本數據集對所述初始文本信息識別模型進行訓練,得到文本信息識別模型。
2.根據權利要求1所述的方法,其中,所述基于所述訓練樣本數據集對所述初始文本信息識別模型進行訓練,得到文本信息識別模型包括:
基于所述訓練樣本數據集中的訓練樣本,構建所述初始文本信息識別模型的損失函數;其中,所述損失函數包括均方錯誤誤差函數;
將所述訓練樣本輸入至所述初始文本信息識別模型中,得到預測類別標簽;
將所述預測類別標簽與所述初始類別標簽輸入所述損失函數,得到損失結果;
根據所述損失結果調整所述初始文本信息識別模型中的參數,直到所述損失函數收斂;以及
將所述損失函數收斂時對應的模型作為所述文本信息識別模型。
3.根據權利要求2所述的方法,其中,所述初始文本信息識別模型還包括特征向量表征網絡、注意力機制層、輸出層;
所述將所述訓練樣本輸入至所述初始文本信息識別模型中,得到預測類別標簽包括:
利用所述特征向量表征網絡處理所述訓練樣本的文本信息,得到第一中間特征;
利用所述空洞卷積網絡模塊處理所述第一中間特征,得到第二中間特征;
利用所述雙向長短期記憶網絡模塊處理所述第一中間特征,得到第三中間特征;
利用所述注意力機制層處理所述第二中間特征和所述第三中間特征,得到第四中間特征;以及
利用所述輸出層處理所述第四中間特征,得到所述預測類別標簽。
4.根據權利要求3所述的方法,其中,所述空洞卷積網絡模塊包括依次串聯的M個組合網絡以及自注意力機制層,其中,所述組合網絡包括并聯的空洞卷積網絡、池化層和歸一化處理層;所述M為大于等于1的整數;
其中,所述雙向長短期記憶網絡模塊包括依次串聯的N個雙向長短期記憶網絡和自注意力機制層,其中,所述N為大于等于1的整數;
其中,所述輸出層包括依次串聯的全局池化層和X層線性層,其中X為大于等于1的整數。
5.根據權利要求2所述的方法,其中,所述將所述預測類別標簽與所述初始類別標簽輸入所述損失函數,得到損失結果包括:
基于所述預測類別標簽與所述初始類別標簽,通過均方錯誤誤差函數分別計算違規信息類別的第一損失和合規信息類別的第二損失;以及
基于所述第一損失和所述第二損失,確定所述損失函數的損失。
6.根據權利要求1所述的方法,還包括:
將所述訓練樣本輸入至所述文本信息識別模型中,得到所述訓練樣本的預測類別標簽;
將所述預測類別標簽與所述訓練樣本的初始類別標簽進行匹配,得到匹配結果,其中,所述匹配結果用于表征所述預測類別標簽與所述初始類別標簽是否一致;
在表征所述預測類別標簽與所述初始類別標簽一致的匹配結果數量滿足預設條件的情況下,得到所述文本信息識別模型;
在表征所述預測類別標簽與所述初始類別標簽一致的匹配結果數量不滿足所述預設條件的情況下,修改與所述預測類別標簽不一致的初始類別標簽;以及
基于修改標簽后的訓練樣本訓練所述文本信息識別模型。
7.根據權利要求1所述的方法,所述獲取訓練樣本數據集包括:
基于所述目標關鍵詞獲取電商平臺中的初始文本信息;
對所述初始文本信息進行數據處理,得到所述文本信息;
利用先驗知識對所述文本信息進行打標,得到所述文本信息的初始類別標簽;以及
基于所述文本信息和所述初始類別標簽,得到訓練樣本數據集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京沃東天駿信息技術有限公司;北京京東世紀貿易有限公司,未經北京沃東天駿信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110186799.8/1.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





