[發明專利]一種長短信精簡方法及系統有效
| 申請號: | 201811333876.2 | 申請日: | 2018-11-09 |
| 公開(公告)號: | CN109657231B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 黃曉波;黃巨濤;林強;唐亮亮;陳守明;肖建毅;臧笑宇;王飛鳴;吳麗瓊 | 申請(專利權)人: | 廣東電網有限責任公司;廣東電網有限責任公司信息中心 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F16/332;G06N3/084 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 羅滿 |
| 地址: | 510600 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 短信 精簡 方法 系統 | ||
1.一種長短信精簡方法,其特征在于,包括:
利用分詞算法對長短信進行分詞處理得到對應的特征詞表及特征詞空間;
利用所述特征詞表和所述特征詞空間得到對應的特征向量;
將所述特征向量代入BP神經網絡進行訓練,得到輸出向量;
根據所述輸出向量,利用特征詞庫中的精簡等價短詞對所述特征詞表中的目標特征詞進行替換,形成目標特征詞表;
利用所述分詞算法對應的逆算法對所述目標特征詞表進行處理,得到目標長短信。
2.根據權利要求1所述的長短信精簡方法,其特征在于,所述利用分詞算法對長短信進行分詞處理得到對應的特征詞表及特征詞空間,包括:
利用所述分詞算法對所述長短信進行分詞處理得到各個特征詞及對應的特征詞空間、各個停用詞及對應的停用詞空間;
根據停用詞庫過濾各個所述停用詞及對應的停用詞空間,得到所述特征詞表及所述特征詞空間。
3.根據權利要求1所述的長短信精簡方法,其特征在于,將所述特征向量代入BP神經網絡進行訓練之后,還包括:
利用所述BP神經網絡將所述特征向量對應的特征詞表保存至所述特征詞庫中。
4.根據權利要求1所述的長短信精簡方法,其特征在于,所述利用特征詞庫中的精簡等價短詞對所述特征詞表中的目標特征詞進行替換,包括:
在所述特征詞庫中建立所述精簡等價短詞與所述目標特征詞之間的映射關系;
利用所述精簡等價短詞對所述目標特征詞進行替換。
5.一種長短信精簡系統,其特征在于,包括:
分詞處理模塊,用于利用分詞算法對長短信進行分詞處理得到對應的特征詞表及特征詞空間;
特征向量獲取模塊,用于利用所述特征詞表和所述特征詞空間得到對應的特征向量;
BP神經網絡訓練模塊,用于將所述特征向量代入BP神經網絡進行訓練,得到輸出向量;
目標特征詞替換模塊,用于根據所述輸出向量,利用特征詞庫中的精簡等價短詞對所述特征詞表中的目標特征詞進行替換,形成目標特征詞表;
目標特征詞表處理模塊,用于利用所述分詞算法對應的逆算法對所述目標特征詞表進行處理,得到目標長短信。
6.根據權利要求5所述的長短信精簡系統,其特征在于,所述分詞處理模塊包括:
分詞處理單元,用于利用所述分詞算法對所述長短信進行分詞處理得到各個特征詞及對應的特征詞空間、各個停用詞及對應的停用詞空間;
過濾單元,用于根據停用詞庫過濾各個所述停用詞及對應的停用詞空間,得到所述特征詞表及所述特征詞空間。
7.根據權利要求5所述的長短信精簡系統,其特征在于,還包括:
存儲模塊,用于利用所述BP神經網絡將所述特征向量對應的特征詞表保存至所述特征詞庫中。
8.根據權利要求5所述的長短信精簡系統,其特征在于,所述目標特征詞替換模塊包括:
映射關系建立單元,用于在所述特征詞庫中建立所述精簡等價短詞與所述目標特征詞之間的映射關系;
目標特征詞替換單元,用于利用所述精簡等價短詞對所述目標特征詞進行替換。
9.一種用于實現長短信精簡方法的設備,其特征在于,包括:
存儲器和處理器;其中,所述存儲器用于存儲計算機程序,所述處理器用于執行所述計算機程序時實現如權利要求1至4任一項所述的長短信精簡方法的步驟。
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序被處理器執行時實現如權利要求1至4任一項所述的長短信精簡方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東電網有限責任公司;廣東電網有限責任公司信息中心,未經廣東電網有限責任公司;廣東電網有限責任公司信息中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811333876.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:融合詞向量和詞性向量的命名實體識別方法及裝置
- 下一篇:一種意圖識別方法





