[發明專利]一種確定汽車維修文檔主題的方法及相關設備在審
| 申請號: | 201811075837.7 | 申請日: | 2018-09-14 |
| 公開(公告)號: | CN109446318A | 公開(公告)日: | 2019-03-08 |
| 發明(設計)人: | 劉均;劉新;鄧思超 | 申請(專利權)人: | 深圳市元征科技股份有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F17/21;G06F17/22;G06F17/27 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 郝傳鑫;熊永強 |
| 地址: | 518000 廣東省深圳市龍*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 汽車維修 待分類文檔 文檔主題 特征詞 文檔 概率計算 維修技術 維修 概率 申請 詞匯 辨別 | ||
1.一種確定汽車維修文檔主題的方法,其特征在于,包括:
獲取待分類文檔和維修主題,所述待分類文檔包含汽車維修信息,所述維修主題為與汽車維修相關的主題;
獲得所述待分類文檔的特征詞集,所述特征詞集為所述待分類文檔的特征詞匯的集合;
依據所述特征詞集以及詞匯概率計算主題概率,所述詞匯概率為所述特征詞集中各特征詞匯在語意上表達所述維修主題的概率,所述主題概率為所述待分類文檔對應到所述維修主題的概率;
依據所述主題概率,確定所述維修主題是否作為所述待分類文檔的主題。
2.根據權利要求1所述方法,其特征在于,所述獲取待分類文檔和維修主題,包括:
接收待分類的維修數據;將所述維修數據轉化為所述待分類文檔。
3.根據權利要求1所述方法,其特征在于,所述獲得所述待分類文檔的特征詞集,包括:
通過文本分詞算法對所述待分類文檔進行分詞,得到所述待分類文檔的詞匯集;
刪除所述詞匯集中的停用詞,得到所述特征詞集。
4.根據權利要求1所述方法,其特征在于,在所述獲取待分類文檔和維修主題之后,在所述依據所述特征詞集以及詞匯概率計算主題概率之前,還包括:
獲取訓練文檔集,所述訓練文檔集為訓練文檔的集合,所述訓練文檔包含汽車維修信息;
獲取所述訓練文檔集的訓練詞集;所述訓練詞集為所述訓練文檔集的特征詞匯的集合;
將所述訓練詞集和所述維修主題輸入隱含狄利克雷分布LDA模型中,輸出所述詞匯概率。
5.根據權利要求1或4所述方法,其特征在于,所述依據所述特征詞集以及詞匯概率計算主題概率,包括:
將所述特征詞集和所述詞匯概率輸入隱含狄利克雷分布LDA模型中,輸出所述主題概率。
6.一種確定汽車維修文檔主題的設備,其特征在于,包括:
第一獲取單元,用于獲取待分類文檔和維修主題,所述待分類文檔包含汽車維修信息,所述維修主題為與汽車維修相關的主題;
第二獲取單元,用于獲取所述待分類文檔的特征詞集,所述特征詞集為所述待分類文檔的特征詞匯的集合;
主題概率計算單元,用于依據所述特征詞集以及詞匯概率計算主題概率,所述詞匯概率為所述特征詞集中各特征詞匯在語意上表達所述維修主題的概率,所述主題概率為所述待分類文檔對應到所述維修主題的概率;
確定單元,用于依據所述主題概率,確定所述維修主題是否作為所述待分類文檔的主題。
7.根據權利要求6所述設備,其特征在于,還包括:
第三獲取單元,用于獲取訓練文檔集,所述訓練文檔集為訓練文檔的集合,所述訓練文檔包含汽車維修信息;
第四獲取單元,用于獲取所述訓練文檔集的特征詞集,所述訓練詞集為所述訓練文檔集的特征詞匯的集合;
詞匯概率計算單元,用于將所述訓練詞集和所述維修主題輸入隱含狄利克雷分布LDA模型中,輸出所述詞匯概率。
8.根據權利要求6或者7所述設備,其特征在于,所述計算單元具體用于將特征詞集和所述詞匯概率輸入隱含狄利克雷分布LDA模型中,輸出主題概率。
9.一種確定汽車維修文檔主題的設備,其特征在于,包括處理器、存儲器、數據庫單元、網絡接口、通信總線和用戶接口;所述處理器、所述存儲器、所述數據庫單元、所述網絡接口和所述用戶接口通過所述通信總線相互連接;其中,所述存儲器用于存儲計算機程序,所述計算機程序包括程序指令,所述處理器被配置用于調用所述程序指令,執行如權利要求1~6任一項所述的一種確定汽車維修文檔主題方法。
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序包括程序指令,所述程序指令當被處理器執行時使所述處理器執行如權利要求1~5任一項所述的一種確定汽車維修文檔主題的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市元征科技股份有限公司,未經深圳市元征科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811075837.7/1.html,轉載請聲明來源鉆瓜專利網。





