[發明專利]一種搜索關鍵詞獲取的方法及裝置在審
| 申請號: | 201710047106.0 | 申請日: | 2017-01-22 |
| 公開(公告)號: | CN106844647A | 公開(公告)日: | 2017-06-13 |
| 發明(設計)人: | 駱宗偉;韓帥;劉金群;李斌;粟隆澤;周興友;張宇;張詩奇;石一凡 | 申請(專利權)人: | 南方科技大學;深圳市傲天科技股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 北京品源專利代理有限公司11332 | 代理人: | 孟金喆,胡彬 |
| 地址: | 518000 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 搜索關鍵詞 獲取 方法 裝置 | ||
技術領域
本發明實施例涉及信息處理技術領域,尤其涉及一種搜索關鍵詞獲取的方法及裝置。
背景技術
隨著互聯網的快速發展,人們逐漸通過依靠互聯網搜索的結果作為獲取信息的入口。通過對用戶搜索關鍵詞的分析,可以獲得用戶的興趣所在以及關注的熱點,更可以挖掘出用戶自身的偏好以及業務的潛在關聯項目。
目前的搜索關鍵詞獲取的方法,大多是直接在搜索框中輸入的文本中提取預設個數的關鍵詞作為搜索關鍵詞,如將輸入的文本進行分詞,將分詞后獲得的候選關鍵詞排序,提取預設個數的候選關鍵詞作為用戶的搜索關鍵詞。具體的,若用戶在搜索框中鍵入“汽車模具”或“汽車維修”,則會將“汽車”和“模具”或“汽車”和“維修”作為搜索關鍵詞。
然而,上述方法中,在分析用戶的興趣時,會將獲得的所有關鍵詞均作為用戶的興趣所在,如若輸入的文本為“汽車模具”,會將“汽車”以及“模具”均作為用戶的興趣,然而用戶的興趣重點在于“模具”,而不是“汽車”,使得通過用戶搜索關鍵詞不能準確地確定用戶的興趣及關注的熱點。
發明內容
本發明提供一種搜索關鍵詞獲取的方法及裝置,以實現根據用戶輸入的文本信息比較準確地輸出與用戶的某一興趣或需求相關的關鍵詞。
第一方面,本發明實施例提供了搜索關鍵詞獲取的方法,該方法包括:
統計目標領域的特定相關關鍵詞和特定無關關鍵詞;
將獲取的待分析文本進行分詞得到候選關鍵詞;
將每個所述候選關鍵詞與所述特定無關關鍵詞進行匹配;
若每個所述候選關鍵詞均匹配失敗,則計算每個所述候選關鍵詞的詞向量與所述目標領域的每個特定相關關鍵詞的詞向量的相似度;
若所述相似度大于預設閾值,則將該目標領域的特定相關關鍵詞作為待分析文本的關鍵詞輸出。
第二方面,本發明實施例還提供了一種搜索關鍵詞獲取的裝置,該裝置包括:
關鍵詞統計模塊,用于統計目標領域的特定相關關鍵詞和特定無關關鍵詞;
文本分詞模塊,用于將獲取的待分析文本進行分詞得到候選關鍵詞;
關鍵詞匹配模塊,用于將每個所述候選關鍵詞與所述特定無關關鍵詞進行匹配;
相似度計算模塊,用于若每個所述候選關鍵詞均匹配失敗,則計算每個所述候選關鍵詞的詞向量與所述目標領域的每個特定相關關鍵詞的詞向量的相似度;
關鍵詞輸出模塊,用于若所述相似度大于預設閾值,則將該目標領域的特定相關關鍵詞作為待分析文本的關鍵詞輸出。
本發明通過統計目標領域的特定相關關鍵詞和特定無關關鍵詞;將獲取的待分析文本進行分詞得到候選關鍵詞;將每個候選關鍵詞與特定無關關鍵詞進行匹配;若每個候選關鍵詞均匹配失敗,則計算每個候選關鍵詞的詞向量與所述目標領域的每個特定相關關鍵詞的詞向量的相似度;若相似度大于預設閾值,則將該目標領域的特定相關關鍵詞作為待分析文本的關鍵詞輸出,實現根據用戶輸入的文本信息比較準確地確定與用戶的某一興趣或需求相關的關鍵詞,并將與候選關鍵詞語義相似度較高的該目標領域的特定相關關鍵詞作為待分析文本的關鍵詞輸出,豐富用戶的搜索關鍵詞。
附圖說明
圖1是本發明實施例一中的一種搜索關鍵詞獲取的方法的流程圖;
圖2是本發明實施例二中的一種搜索關鍵詞獲取的方法的流程圖;
圖3是本發明實施例三中的一種搜索關鍵詞獲取的裝置的結構框圖。
具體實施方式
下面結合附圖和實施例對本發明作進一步的詳細說明。可以理解的是,此處所描述的具體實施例僅僅用于解釋本發明,而非對本發明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與本發明相關的部分而非全部結構。
實施例一
圖1為本發明實施例一提供的一種搜索關鍵詞獲取的方法的流程圖,本實施例可適用于獲取搜索關鍵詞的情況,該方法可以由搜索關鍵詞獲取的裝置來執行,具體包括如下步驟:
步驟110、統計目標領域的特定相關關鍵詞和特定無關關鍵詞。
其中,目標領域可為研究用戶的某一興趣或需求而確定的領域,如目標領域可為研究用戶是否有購車的意愿而確定的汽車領域或為研究用戶是否有旅游的意愿而確定的旅游領域等。
特定相關關鍵詞為與用戶的某一興趣或需求相關的關鍵詞。特定無關關鍵詞為與用戶的該興趣或需求無關的關鍵詞,其中,特定無關關鍵詞通常會與某些特定相關關鍵詞同時出現或語義相似度較高,而其往往與用戶該興趣或需求無關。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南方科技大學;深圳市傲天科技股份有限公司,未經南方科技大學;深圳市傲天科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710047106.0/2.html,轉載請聲明來源鉆瓜專利網。





