[發明專利]一種基于主題的搜索優化方法有效
| 申請號: | 201711178366.8 | 申請日: | 2017-11-23 |
| 公開(公告)號: | CN107784123B | 公開(公告)日: | 2021-01-01 |
| 發明(設計)人: | 黃浩 | 申請(專利權)人: | 北京中科智營科技發展有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33 |
| 代理公司: | 北京天方智力知識產權代理事務所(普通合伙) 11719 | 代理人: | 谷成 |
| 地址: | 100029 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 主題 搜索 優化 方法 | ||
本發明公開了一種基于主題的搜索優化方法,該搜索優化方法包括如下步驟:步驟1,獲取用戶提供的數據集,所述數據集中包含用戶所屬領域的詞匯;步驟2,利用所述詞匯生成主題,主題中包含預設關鍵詞及詞間邏輯關系;步驟3,讀取用戶向搜索引擎輸入的目標關鍵詞,將所述目標關鍵詞與所述預設關鍵詞進行匹配,根據所述詞間邏輯關系向用戶展示搜索結果。本發明提供了一種符合用戶需求的搜索方法,不僅能有效地提高搜索的準確性和智能性,而且能對搜索結果進行優化,高效率地為用戶提供精準的搜索結果。
技術領域
本發明涉及全文搜索引擎技術領域,更為具體來說,本發明為一種基于主題的搜索優化方法。
背景技術
目前,傳統的全文搜索引擎通過索引掃描全文中的每一個詞,然后對每個詞進行索引,指明每個詞在文章中出現的次數和位置;用戶進行搜索操作時,全文搜索引擎根據建立好的索引進行查找,將查找的結果反饋給用戶。但是,隨著知識庫的擴大和用戶知識水平的不斷提高,這種類似于“通過字典中的檢索子表查字”的方式已經無法滿足用戶的需求。
上述傳統的搜索方法存在如下問題:(1)搜索結果往往與用戶的意圖不相關;(2)有用的搜索結果排序過于靠后。比如,當用戶輸入“阿里云安全”時,顯示的搜索結果往往是“阿里云”、“網絡安全”等等類似的結果,對相關領域的技術人員來說,很顯然,這并不是用戶需要的結果。
因此,如何使搜索結果符合用戶意圖、將有用的搜索結果優先展示給用戶,成為了本領域技術人員亟待解決的技術問題和始終研究的重點。
發明內容
為解決傳統的全文搜索引擎提供的搜索結果與用戶的意圖相差過大、有用的搜索結果排序過于靠后等問題,本發明創新提出了一種基于主題的搜索優化方法,從而解決現有技術中存在的搜索不智能、不準確、難優化等問題,有效提高了全文搜索的智能性和分類的準確性。
為實現上述技術目的,本發明公開了一種基于主題的搜索優化方法,所述搜索優化方法包括如下步驟:
步驟1,獲取用戶提供的數據集,所述數據集中包含用戶所屬領域的詞匯;
步驟2,利用所述詞匯生成主題,所述主題中包含預設關鍵詞及詞間邏輯關系;
步驟3,讀取用戶向搜索引擎輸入的目標關鍵詞,將所述目標關鍵詞與所述預設關鍵詞進行匹配,根據所述詞間邏輯關系向用戶展示搜索結果。
本發明不僅能夠解決傳統的全文搜索引擎存在的搜索結果與用戶的意圖相差過大、有用的搜索結果排序過于靠后等問題,而且能夠滿足用戶定制化的需求,使搜索結果極大地符合用戶需要,且搜索效率非常高。
進一步地,步驟2中,所述詞間邏輯關系包括詞間關聯關系,并為相關聯的預設關鍵詞賦予凸顯標記;
步驟3中,將與目標關鍵詞成功匹配、且被賦予凸顯標記的相關聯的預設關鍵詞所在的搜索結果優先展示。
基于上述改進的技術方案,本發明能針對用戶輸入的具有關聯關系的多個目標關鍵詞進行更為高效的展示,提高用戶搜索的精準度。
進一步地,步驟2中,按照凸顯標記由大到小的順序,所述詞間關聯關系包括下述關系中的至少一種:多個預設關鍵詞間緊鄰且順序出現、多個預設關鍵詞間相隔字符小于N個、多個預設關鍵詞在一個自然句中出現、多個預設關鍵詞在一個段落中出現、多個預設關鍵詞在一個文章中出現;
步驟3中,如果存在與目標關鍵詞成功匹配且具有不同的凸顯標記的多個預設關鍵詞,則按照凸顯標記由大到小的順序依次展示搜索結果。
基于上述改進的技術方案,如果用戶輸入的多個目標關鍵詞之間同時存在至少兩種此間關聯關系,本發明能實現將更符合用戶意圖的搜索結果優先展示。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京中科智營科技發展有限公司,未經北京中科智營科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711178366.8/2.html,轉載請聲明來源鉆瓜專利網。





