[發明專利]相關度獲取方法、裝置、服務器組以及可讀存儲介質在審
| 申請號: | 201810263239.6 | 申請日: | 2018-03-28 |
| 公開(公告)號: | CN108491391A | 公開(公告)日: | 2018-09-04 |
| 發明(設計)人: | 宋時雨 | 申請(專利權)人: | 聯想(北京)有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/30 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 郄晨芳;王寶筠 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 詞匯 相關度 權重 預設 文本 可讀存儲介質 服務器組 | ||
本發明實施例公開的相關度獲取方法、裝置、服務器組以及可讀存儲介質,獲得該待測文本包括的至少一個詞匯,針對每一詞匯,獲得該詞匯分別在各預設主題的第一權重,獲取該詞匯在待測文本的第二權重;針對每一個預設主題,將所述至少一個詞匯分別在該預設主題的第一權重與相應詞匯在所述待測文本的第二權重的乘積的和,確定為所述待測文本與該預設主題的相關度。從而實現了獲得文本相關度方法。
技術領域
本發明涉及分類技術領域,更具體的說,是涉及相關度獲取方法、裝置、服務器組以及可讀存儲介質。
背景技術
隨著互聯網技術的發展,用戶可以在網絡上發布文章或評論等文本,文本所表達的內容可能與多個主題相關,例如,用戶發表的電腦的評論可能包括:電腦性能、電腦外觀等等,那么該評論與電腦性能和電腦外觀等主題相關。
獲得文本與主題的相關度,可以得知用戶對產品的需求,或者,可以對文本進行分類等等,因此,本領域技術人員需要研究如何獲得文本與主題相關度的技術。
發明內容
有鑒于此,本發明提供了一種相關度獲取方法、裝置、服務器組以及可讀存儲介質,以實現獲得文本與主題相關度的目的。
為實現上述目的,本發明提供如下技術方案:
一種相關度獲取方法,包括:
獲取待測文本包含的至少一個詞匯;
獲取所述至少一個詞匯分別在各預設主題的第一權重,其中,一個詞匯在一個預設主題對應的第一權重與該詞匯在屬于該預設主題的文本中出現的頻次有關;
獲取所述至少一個詞匯分別在所述待測文本的第二權重;
針對每一預設主題,將所述至少一個詞匯分別在該預設主題的第一權重與相應詞匯在所述待測文本的第二權重的乘積的和,確定為所述待測文本與該預設主題的相關度,以得到所述待測文本分別與各預設主題的相關度。
一種相關度獲取裝置,包括:
第一獲取模塊,用于獲取待測文本包含的至少一個詞匯;
第二獲取模塊,用于獲取所述至少一個詞匯分別在各預設主題的第一權重,其中,一個詞匯在一個預設主題對應的第一權重與該詞匯在屬于該預設主題的文本中出現的頻次有關;
第三獲取模塊,用于獲取所述至少一個詞匯分別在所述待測文本的第二權重;
確定模塊,用于針對每一預設主題,將所述至少一個詞匯分別在該預設主題的第一權重與相應詞匯在所述待測文本的第二權重的乘積的和,確定為所述待測文本與該預設主題的相關度,以得到所述待測文本分別與各預設主題的相關度。
一種服務器組,包括:
存儲器,用于存儲程序;
處理器,用于執行所述程序,以進行如下操作:
獲取待測文本包含的至少一個詞匯;
獲取所述至少一個詞匯分別在各預設主題的第一權重,其中,一個詞匯在一個預設主題對應的第一權重與該詞匯在屬于該預設主題的文本中出現的頻次有關;
獲取所述至少一個詞匯分別在所述待測文本的第二權重;
針對每一預設主題,將所述至少一個詞匯分別在該預設主題的第一權重與相應詞匯在所述待測文本的第二權重的乘積的和,確定為所述待測文本與該預設主題的相關度,以得到所述待測文本分別與各預設主題的相關度。
一種可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執行時,實現如上述任一項所述的相關度獲取方法的各個步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于聯想(北京)有限公司,未經聯想(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810263239.6/2.html,轉載請聲明來源鉆瓜專利網。





