[發明專利]一種確定汽車維修文檔主題的方法及相關設備在審
| 申請號: | 201811075837.7 | 申請日: | 2018-09-14 |
| 公開(公告)號: | CN109446318A | 公開(公告)日: | 2019-03-08 |
| 發明(設計)人: | 劉均;劉新;鄧思超 | 申請(專利權)人: | 深圳市元征科技股份有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F17/21;G06F17/22;G06F17/27 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 郝傳鑫;熊永強 |
| 地址: | 518000 廣東省深圳市龍*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 汽車維修 待分類文檔 文檔主題 特征詞 文檔 概率計算 維修技術 維修 概率 申請 詞匯 辨別 | ||
本申請公開了一種確定汽車維修文檔主題的方法以及相關設備,該方法包括:獲取待分類文檔和維修主題;獲得所述待分類文檔的特征詞集;依據所述特征詞集以及詞匯概率計算主題概率;依據所述主題概率,確定所述維修主題是否作為所述待分類文檔的主題。采用本申請,可以準確地識別汽車維修文檔的主題,提高辨別汽車維修文檔的效率,節省維修技術人員的時間。
技術領域
本申請涉及計算機技術領域,尤其涉及一種確定汽車維修文檔主題的方法及相關設備。
背景技術
在汽車維修過程中,會產生大量的維修文檔。這些文檔包含許多與汽車維修相關的信息,對這些信息進行有效利用,可以提高汽車維修廠維修水平,增加客戶的滿意度。而識別汽車維修文檔所描述的主題,可以針對上述主題給出相應的建議和方案,給維修過程帶來有益效果。上述主題的類型包括車型、故障模塊、車輛品牌等。一般來說,由于汽車零配件繁多,系統復雜,一篇維修文檔中通常會提到多個車型、零部件或者系統,維修技術人員需要仔細閱讀,才能準確地判斷這些維修文檔所描述的主題。在這個過程中,維修技術人員耗費了大量時間和精力。
現有技術通過關鍵詞匹配方法,搜索汽車維修文檔中與某個主題相匹配的關鍵詞,進而判斷該文檔的主題。但是,這種方法層次比較簡單,無法準確地判斷汽車維修文檔的主題。
發明內容
本申請提出一種確定汽車維修文檔主題的方法及相關設備,可以用于確定汽車維修文檔的主題,提高辨別汽車維修文檔的效率。
第一方面,本申請提出一種確定汽車維修文檔主題的方法,包括:
獲取待分類文檔和維修主題,所述待分類文檔包含汽車維修信息,所述維修主題為與汽車維修相關的主題;
獲得所述待分類文檔的特征詞集,所述特征詞集為所述待分類文檔的特征詞匯的集合;
依據所述特征詞集以及詞匯概率計算主題概率,所述詞匯概率為所述特征詞集中各特征詞匯在語意上表達所述維修主題的概率,所述主題概率為所述待分類文檔對應到所述維修主題的概率;
依據所述主題概率,確定所述維修主題是否作為所述待分類文檔的主題。
結合第一方面,在一種可能的實現方式中,在所述獲取待分類文檔和維修主題之后,在所述依據所述特征詞集以及詞匯概率計算主題概率之前,還包括:
獲取訓練文檔集,所述訓練文檔集為訓練文檔的集合,所述訓練文檔包含汽車維修信息;
獲取所述訓練文檔集的訓練詞集;所述訓練詞集為所述訓練文檔集的特征詞匯的集合;
將所述訓練詞集和所述維修主題輸入隱含狄利克雷分布LDA模型中,輸出所述詞匯概率。
結合第一方面,在一種可能的實現方式中,所述依據所述特征詞集以及詞匯概率計算主題概率,包括:
將所述特征詞集和所述詞匯概率輸入隱含狄利克雷分布LDA模型中,輸出所述主題概率。
結合第一方面,在一種可能的實現方式中,在依據所述主題概率,確定所述維修主題是否作為所述待分類文檔的主題之后,還包括:
若確定所述維修主題作為所述待分類文檔的維修主題,則將所述維修主題添加到所述待分類文檔的標題中;或者,將所述待分類文檔存儲到所述維修主題所對應的存儲區域。
第二方面,本申請實施例提供了一種確定汽車維修文檔主題的設備,包括:
第一獲取單元,用于獲取待分類文檔和維修主題,所述待分類文檔包含汽車維修信息,所述維修主題為與汽車維修相關的主題;
第二獲取單元,用于獲取所述待分類文檔的特征詞集,所述特征詞集為所述待分類文檔的特征詞匯的集合;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市元征科技股份有限公司,未經深圳市元征科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811075837.7/2.html,轉載請聲明來源鉆瓜專利網。





