[發明專利]關聯話題的識別方法和裝置有效
| 申請號: | 201410779602.1 | 申請日: | 2014-12-15 |
| 公開(公告)號: | CN104408036B | 公開(公告)日: | 2019-01-08 |
| 發明(設計)人: | 劉粉香 | 申請(專利權)人: | 北京國雙科技有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 吳貴明;張永明 |
| 地址: | 100086 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 關聯 話題 識別 方法 裝置 | ||
1.一種關聯話題的識別方法,其特征在于,包括:
獲取目標關鍵詞;
用機器學習方法確定所述目標關鍵詞對應的多維數組,其中,所述多維數組中每一維度數字用于表示所述目標關鍵詞的一個屬性;
計算所述目標關鍵詞對應的多維數組與目標話題對應的多維數組之間的關聯指數,其中,所述關聯指數用于表示所述目標關鍵詞與每一個所述目標話題之間的關聯性,所述目標話題為預先標記的具有多維數組的多個話題,用于表示話題的多維數組的維度數量與表示目標關鍵詞的維度數量相同;以及
根據計算得到的關聯指數確定出與所述目標關鍵詞相關聯的話題;
其中,根據計算得到的關聯指數確定出與所述目標關鍵詞關聯的話題包括:
判斷所述計算得到的關聯指數是否滿足預設條件;
如果判斷出所述計算得到的關聯指數滿足所述預設條件,則確定所述計算得到的關聯指數滿足所述預設條件的目標話題與所述目標關鍵詞相關聯;
如果判斷出所述計算得到的關聯指數不滿足所述預設條件,則確定所述計算得到的關聯指數不滿足所述預設條件的目標話題與所述目標關鍵詞不相關;
其中,每個所述目標話題對應一個唯一的多維數組。
2.根據權利要求1所述的識別方法,其特征在于,計算所述目標關鍵詞對應的多維數組與目標話題對應的多維數組之間的關聯指數包括:
計算所述目標關鍵詞對應的多維數組與所述目標話題對應的多維數組之間的歐氏距離,將所述歐氏距離作為所述關聯指數,其中,所述目標關鍵詞與話題之間的歐氏距離越小表示所述目標關鍵詞與所述話題之間的關聯性越高。
3.根據權利要求1所述的識別方法,其特征在于,計算所述目標關鍵詞對應的多維數組與所述目標話題對應的多維數組之間的關聯指數包括:
獲取所述目標話題對應的多維數組;直接計算所述目標關鍵詞對應的多維數組所述目標話題對應的多維數組之間的關聯指數,
或者,
獲取所述目標話題中每個詞語對應的多維數組;計算所述目標關鍵詞對應的多維數組與所述目標話題中每個詞語對應的多維數組之間的關聯指數;由所述目標關鍵詞對應的多維數組與所述每個詞語對應的多維數組之間的關聯指數計算得到所述目標關鍵詞對應的多維數組與所述目標話題對應的多維數組之間的關聯指數。
4.根據權利要求1所述的識別方法,其特征在于,在獲取目標關鍵詞之前,所述識別方法還包括:
獲取目標文本,所述目標文本中包含有所述目標話題;
利用分詞工具對所述目標文本進行分詞,并標記出所述目標文本中每個詞語的詞性;
按照預先建立的詞性規則模型根據分詞后的詞語的詞性確定出所述目標話題,并對所述目標話題進行標記;以及
確定分詞后的每個詞對應的多維數組和所述目標話題對應的多維數組。
5.一種關聯話題的識別裝置,其特征在于,包括:
第一獲取單元,用于獲取目標關鍵詞;
第一確定單元,用于用機器學習方法確定所述目標關鍵詞對應的多維數組,其中,所述多維數組中每一維度數字用于表示所述目標關鍵詞的一個屬性;
計算單元,用于計算所述目標關鍵詞對應的多維數組與目標話題對應的多維數組之間的關聯指數,其中,所述關聯指數用于表示所述目標關鍵詞與每一個所述目標話題之間的關聯性,所述目標話題為預先標記的具有多維數組的多個話題,用于表示話題的多維數組的維度數量與表示目標關鍵詞的維度數量相同;以及
第二確定單元,用于根據計算得到的關聯指數確定出與所述目標關鍵詞相關聯的話題;
其中,所述第二確定單元包括:
判斷模塊,用于判斷所述計算得到的關聯指數是否滿足預設條件;
確定模塊,用于如果判斷出所述計算得到的關聯指數滿足所述預設條件,則確定所述計算得到的關聯指數滿足所述預設條件的目標話題與所述目標關鍵詞相關聯;如果判斷出所述計算得到的關聯指數不滿足所述預設條件,則確定所述計算得到的關聯指數不滿足所述預設條件的目標話題與所述目標關鍵詞不相關;
其中,每個所述目標話題對應一個唯一的多維數組。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京國雙科技有限公司,未經北京國雙科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410779602.1/1.html,轉載請聲明來源鉆瓜專利網。





