[發明專利]一種工單分類方法、裝置、及計算機存儲介質在審
| 申請號: | 202010684484.1 | 申請日: | 2020-07-16 |
| 公開(公告)號: | CN111651608A | 公開(公告)日: | 2020-09-11 |
| 發明(設計)人: | 常文釗;延亮;儲偉;顧林清;李洋;樂雨泉;何嘉偉 | 申請(專利權)人: | 國網甘肅省電力公司天水供電公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/284;G06F40/289;G06N3/04;G06Q50/06 |
| 代理公司: | 南京鴻越知識產權代理事務所(普通合伙) 32355 | 代理人: | 徐鳳艷 |
| 地址: | 741000 *** | 國省代碼: | 甘肅;62 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 分類 方法 裝置 計算機 存儲 介質 | ||
1.一種工單分類方法,包括:
獲取待分類的多個工單語料;
對所獲取的每條所述待分類的工單語料進行分詞得到每條所述待分類的工單語料的詞序列;
將所得到的每條所述待分類的工單語料的詞序列輸入預先訓練好的詞向量模型,獲取每條所述待分類的工單語料的詞向量序列,所述詞向量序列包括每個分詞對應的詞向量;
將所獲取的每條所述待分類的工單語料的詞向量序列輸入預先訓練好的膠囊網絡模型,確定每條所述待分類的工單語料的所屬類別,所述膠囊網絡模型包括低層膠囊層、動態路由層、高層膠囊層、及全連接層,所述低層膠囊層包括根據所述詞向量序列得到的低層膠囊序列。
2.根據權利要求1所述的方法,其特征在于,所述將所獲取的每條所述待分類的工單語料的詞向量序列輸入預先訓練好的膠囊網絡模型,確定每條所述待分類的工單語料的所屬類別,包括:
將每條所述待分類的工單語料的詞向量序列E=(e1,e2,...,em}輸入長短時記憶網絡,得到低層膠囊序列u=(u1,u2,...,un},其中ui為第i個低層膠囊;
將得到的低層膠囊序列u輸入動態路由層得到高層膠囊序列v={v1,v2,...,vn},其中vi表示第i個高層膠囊;
將所得到的高層膠囊序列輸入全連接層,采用softmax函數確定每條所述待分類的工單語料的所屬類別。
3.根據權利要求1所述的方法,其特征在于,所述膠囊網絡模型采用如下方式訓練得到:
將語料樣本集中每條語料樣本進行分詞后得到的詞向量序列E=(e1,e2,...,em}并輸入長短時記憶網絡,得到低層膠囊序列u=(u1,u2,...,un},其中ui為第i個低層膠囊;所述工單語料樣本集包括多個工單語料樣本以及每個工單語料樣本對應工單類別;
將所得到的低層膠囊序列輸入動態路由層,得到高層膠囊v={v1,v2,...,vn},其中vi表示第i個高層膠囊;
將所得到的高層膠囊序列輸入全連接層,采用softmax函數,得到所述每條工單語料樣本集屬于對應類別的概率;
根據所得到的所述每條工單語料樣本集屬于對應類別的概率,基于預設的交叉熵損失函數得到總損失,在所述工單語料樣本集上進行模型訓練,并對膠囊網絡模型參數進行調整。
4.根據權利要求2所述的方法,其特征在于,所述詞向量模型采用如下方式訓練得到:
將工單語料樣本集中的每條工單語料樣本進行分詞,得到每條工單語料樣本的詞序列;所述工單語料樣本集包括多個工單語料樣本以及每個工單語料樣本對應的詞向量;
將所得到的所述每條工單語料樣本的詞序列,在詞向量基礎模型上進行無監督訓練得到所述詞向量模型。
5.根據權利要求4所述的方法,其特征在于,所述預先訓練好的詞向量模型是采用word2vec工具在工單語料樣本集無監督訓練得到。
6.根據權利要求2所述的方法,其特征在于,所述工單語料樣本集包括訓練樣本集和測試樣本集,所述訓練樣本集為從預先獲取的工單語料中隨機選取預定比例的工單語料以及對應的類別標簽組成;所述測試樣本集為所述預先獲取的剩余比例的工單語料及對應的類別標簽組成。
7.根據權利要求1所述的方法,其特征在于,所述對所獲取的每條所述待分類的工單語料進行分詞得到每條所述待分類的工單語料的詞序列,包括:采用jieba對所獲取的每條所述待分類的工單語料進行分詞得到每條所述待分類的工單語料的詞序列。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網甘肅省電力公司天水供電公司,未經國網甘肅省電力公司天水供電公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010684484.1/1.html,轉載請聲明來源鉆瓜專利網。





