[發(fā)明專利]一種鐵路安監(jiān)數據處理方法、系統、裝置和存儲介質在審
| 申請?zhí)枺?/td> | 202010536830.1 | 申請日: | 2020-06-12 |
| 公開(公告)號: | CN111881670A | 公開(公告)日: | 2020-11-03 |
| 發(fā)明(設計)人: | 凌政;董選明 | 申請(專利權)人: | 廣州忘平信息科技有限公司 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06K9/62;G06N3/04;G06N3/08;G06Q50/30 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 何文聰 |
| 地址: | 510600 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 鐵路 數據處理 方法 系統 裝置 存儲 介質 | ||
1.一種鐵路安監(jiān)數據處理方法,其特征在于,包括以下步驟:
獲取TextCNN模型;所述TextCNN模型有多個通道;
將所述鐵路安監(jiān)數據分別進行多種詞嵌入處理;各所述詞嵌入處理的種類數與所述TextCNN模型的通道數量相匹配,各所述詞嵌入處理分別產生一個第一詞向量;
將各所述第一詞向量輸入到所述TextCNN模型;
獲取所述TextCNN模型的輸出結果。
2.根據權利要求1所述的鐵路安監(jiān)數據處理方法,其特征在于,所述鐵路安監(jiān)數據包括鐵路安監(jiān)風險問題字典庫和/或鐵路發(fā)牌問題描述記錄。
3.根據權利要求1所述的鐵路安監(jiān)數據處理方法,其特征在于,還包括以下步驟:
使用Jieba分詞算法對所述鐵路安監(jiān)數據進行分詞處理;
對所述鐵路安監(jiān)數據進行去停用詞處理;
確定所述鐵路安監(jiān)數據的標簽;所述標簽用于對所述鐵路安監(jiān)數據進行車務二級分類、車務三級分類或車務四級分類。
4.根據權利要求1所述的鐵路安監(jiān)數據處理方法,其特征在于,所述TextCNN模型經過以下訓練:
將所述鐵路安監(jiān)數據分別進行多種詞嵌入處理;各所述詞嵌入處理的種類數與所述TextCNN模型的通道數量相匹配,各所述詞嵌入處理分別產生一個第二詞向量;
獲取部分或全部所述第二詞向量以組成訓練數據集和測試數據集;
設置所述TextCNN模型訓練參數;
將所述訓練數據集和測試數據集作為所述TextCNN模型的輸入數據,將所述訓練數據集和測試數據集中的所述第二詞向量對應的所述標簽作為所述TextCNN模型的期望輸出,執(zhí)行對所述TextCNN模型的訓練。
5.根據權利要求4所述的鐵路安監(jiān)數據處理方法,其特征在于,所述訓練參數包括批量大小、迭代次數、測試間隔、保存模型間隔、最長輸入長度、詞向量維度、卷積核大小、卷積核深度、學習率和dropout率中的至少一個。
6.根據權利要求1所述的鐵路安監(jiān)數據處理方法,其特征在于,所述多種詞嵌入處理包括Word2vec、Glove、TF-IDF、BOW和One-Hot中的至少兩種。
7.根據權利要求1所述的鐵路安監(jiān)數據處理方法,其特征在于,還包括以下步驟:
當所述鐵路安監(jiān)數據的數據量大于第一數據量閾值,對所述TextCNN模型中的嵌入層進行隨機初始化,在對所述TextCNN模型進行訓練時,對所述嵌入層進行更新;
當所述鐵路安監(jiān)數據的數據量小于第二數據量閾值,對所述第一詞向量進行預訓練,用經過預訓練的所述第一詞向量初始化所述嵌入層;
所述第一數據量閾值不小于所述第二數據量閾值。
8.一種鐵路安監(jiān)數據處理系統,其特征在于,包括:
TextCNN模型模塊,用于獲取TextCNN模型;所述TextCNN模型有多個通道;
詞嵌入處理模塊,用于將所述鐵路安監(jiān)數據分別進行多種詞嵌入處理;各所述詞嵌入處理的種類數與所述TextCNN模型的通道數量相匹配,各所述詞嵌入處理分別產生一個第一詞向量;
輸入模塊,用于將各所述第一詞向量輸入到所述TextCNN模型;
輸出模塊,用于獲取所述TextCNN模型的輸出結果。
9.一種計算機裝置,其特征在于,包括存儲器和處理器,所述存儲器用于存儲至少一個程序,所述處理器用于加載所述至少一個程序以執(zhí)行權利要求1-7任一項所述方法。
10.一種存儲介質,其中存儲有處理器可執(zhí)行的指令,其特征在于,所述處理器可執(zhí)行的指令在由處理器執(zhí)行時用于執(zhí)行如權利要求1-7任一項所述方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州忘平信息科技有限公司,未經廣州忘平信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010536830.1/1.html,轉載請聲明來源鉆瓜專利網。





