[發明專利]一種關鍵詞確定方法、裝置、終端及存儲介質在審
| 申請號: | 201910501917.2 | 申請日: | 2019-06-11 |
| 公開(公告)號: | CN110263335A | 公開(公告)日: | 2019-09-20 |
| 發明(設計)人: | 楚國慶;朱旭琪;閆剛;金竹;孫瑛瑛;劉洋 | 申請(專利權)人: | 北京清博大數據科技有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/22;G06F16/33 |
| 代理公司: | 北京聯瑞聯豐知識產權代理事務所(普通合伙) 11411 | 代理人: | 蘇友娟 |
| 地址: | 100044 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 詞組 特征關鍵詞 關鍵詞確定 刪除 存儲介質 文章集合 預設 相似度計算 終端 排序 關鍵詞組 輸出目標 相似度 全網 還原 檢索 | ||
1.一種關鍵詞確定方法,其特征在于,包括:
刪除第一特征詞組中第一個特征關鍵詞生成當前第二特征詞組,以所述當前第二特征詞組作為關鍵詞進行全網檢索,得到第二文章集合,所述第二文章集合中的文章根據其與目標文章的相似度進行排序,所述第一特征詞組由所述目標文章中的特征關鍵詞組成;
將所述第二文章集合中排序前預設數量的文章與第一文章集合中排序前預設數量的文章進行相似度計算或者將其與所述目標文章進行相似度計算,其中,所述第一文章集合由所述第一特征詞組作為關鍵詞進行全網檢索得到,所述第一文章集合中的文章根據其與所述目標文章的相似度進行排序;
若所述相似度超過預設閾值則刪除所述當前第二特征詞組的第一個特征關鍵詞作為新的第二特征詞組,否則,將所述刪除的特征關鍵詞還原,依次刪除下一個特征關鍵詞作為新的第二特征詞組,直至循環至最后一個特征關鍵詞,輸出目標關鍵詞組。
2.根據權利要求1所述的關鍵詞確定方法,其特征在于,還包括步驟:對目標文章進行分詞處理,得到分詞結果,在所述分詞結果中提取特征關鍵詞。
3.根據權利要求1所述的關鍵詞確定方法,其特征在于,所述第一文章集合為與所述目標文章相似度從高到低排序的文章構成的集合,所述第二文章集合為與所述目標文章相似度從高到低排序的文章構成的集合。
4.根據權利要求1-3任一項所述的關鍵詞確定方法,其特征在于,所述將所述第二文章集合中排序前預設數量的文章與第一文章集合中排序前預設數量的文章進行相似度計算,具體為:分別對所述第二文章集合和第一文章集合中排序位置對應的文章進行相似度計算,將得到的相似度結果取平均值。
5.一種關鍵詞確定裝置,其特征在于,包括:
第二文章集合獲取模塊,用于刪除第一特征詞組中第一個特征關鍵詞生成當前第二特征詞組,以所述當前第二特征詞組作為關鍵詞進行全網檢索,得到第二文章集合,所述第二文章集合中的文章根據其與目標文章的相似度進行排序,所述第一特征詞組由所述目標文章中的特征關鍵詞組成;
相似度計算模塊,用于將所述第二文章集合中排序前預設數量的文章與第一文章集合中排序前預設數量的文章進行相似度計算或者將其與所述目標文章進行相似度計算,其中,所述第一文章集合由所述第一特征詞組作為關鍵詞進行全網檢索得到,所述第一文章集合中的文章根據其與所述目標文章的相似度進行排序;
目標關鍵詞組確定模塊,用于在所述相似度超過預設閾值則刪除所述當前第二特征詞組的第一個特征關鍵詞作為新的第二特征詞組,否則,將所述刪除的特征關鍵詞還原,依次刪除下一個特征關鍵詞作為新的第二特征詞組,直至循環至最后一個特征關鍵詞,輸出目標關鍵詞組。
6.根據權利要求5所述的關鍵詞確定裝置,其特征在于,還包括特征關鍵詞提取模塊,用于對目標文章進行分詞處理,得到分詞結果,在所述分詞結果中提取特征關鍵詞。
7.根據權利要求5所述的關鍵詞確定裝置,其特征在于,所述第二文章集合獲取模塊中,所述第二文章集合為與所述目標文章相似度從高到低排序的文章構成的集合,所述相似度計算模塊中,所述第一文章集合為與所述目標文章相似度從高到低排序的文章構成的集合。
8.根據權利要求5-7任一項所述的關鍵詞確定裝置,其特征在于,所述相似度計算模塊中:所述將所述第二文章集合中排序前預設數量的文章與第一文章集合中排序前預設數量的文章進行相似度計算,具體為:分別對所述第二文章集合和第一文章集合中排序位置對應的文章進行相似度計算,將得到的相似度結果取平均值。
9.一種終端,其特征在于,包括:一個或多個處理器、一個或多個存儲器;所述一個或多個存儲器與所述一個或多個處理器耦合,所述一個或多個存儲器用于存儲計算機程序代碼,所述計算機程序代碼包括計算機指令,當所述一個或多個處理器執行所述計算機指令時,所述終端執行如權利要求1-4任一項所述的關鍵詞確定方法。
10.一種計算機存儲介質,其特征在于,其上存儲計算機指令,當所述計算機指令在終端上運行時,使得所述終端執行如權利要求1-4任一項所述的關鍵詞確定方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京清博大數據科技有限公司,未經北京清博大數據科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910501917.2/1.html,轉載請聲明來源鉆瓜專利網。





