[發明專利]確定檢索結果的方法和裝置在審
| 申請號: | 201810160828.1 | 申請日: | 2018-02-27 |
| 公開(公告)號: | CN108376170A | 公開(公告)日: | 2018-08-07 |
| 發明(設計)人: | 楊鵬 | 申請(專利權)人: | 廣州酷狗計算機科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 郭晶 |
| 地址: | 510660 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標字符串 檢索結果 方法和裝置 目標文本 目標字符 信息檢索技術 分詞處理 檢索效率 文本片段 預先存儲 檢索 | ||
本發明實施例公開了一種確定檢索結果的方法和裝置,屬于信息檢索技術領域。所述方法包括:獲取待檢索的目標字符串;對所述目標字符串進行分詞處理,得到所述目標字符串包含的各目標字符;根據預先存儲的各字符與文本片段的對應關系,確定包含各目標字符的目標文本片段;將得到的所述目標文本片段,確定為所述目標字符串對應的檢索結果。采用本發明,可以提高檢索效率。
技術領域
本發明涉及信息檢索技術領域,特別涉及一種確定檢索結果的方法和裝置。
背景技術
隨著計算機以及信息檢索技術的發展,檢索系統的使用越來越廣泛,比如,服務器可以檢索包含待檢索字符串的文本片段。
具體的,用戶可以根據自己的需求,通過終端輸入待檢索字符串,服務器接收到待檢索字符串后,可以掃描預先存儲的文本數據,即可以以字符為步長,對文本數據與待檢索字符串進行匹配,得到包含待檢索字符串的文本片段。
在實現本發明的過程中,發明人發現相關技術至少存在以下問題:
基于上述處理方式,服務器需要對文本數據進行掃描,往往掃描需要消耗的時間比較多,從而,導致檢索效率較低。
發明內容
為了解決相關技術存在的檢索效率較低的問題,本發明實施例提供了一種確定檢索結果的方法和裝置。所述技術方案如下:
一方面,提供了一種確定檢索結果的方法,所述方法包括:
獲取待檢索的目標字符串;
對所述目標字符串進行分詞處理,得到所述目標字符串包含的各目標字符;
根據預先存儲的各字符與文本片段的對應關系,確定包含各目標字符的目標文本片段;
將得到的所述目標文本片段,確定為所述目標字符串對應的檢索結果。
可選的,所述根據預先存儲的各字符與文本片段的對應關系,確定包含各目標字符的目標文本片段,包括:
對于所述各目標字符中的每個目標字符,根據預先存儲的各字符與文本片段標識的對應關系,確定所述目標字符對應的文本片段標識;
根據各目標字符對應的文本片段標識,在各目標字符對應的文本片段標識中確定目標文本片段標識;
根據預先存儲的文本片段標識與本文片段的對應關系,確定所述目標文本片段標識對應的文本片段,得到包含各目標字符的目標文本片段。
可選的,所述根據各目標字符對應的文本片段標識,在各目標字符對應的文本片段標識中確定目標文本片段標識,包括:
根據各目標字符對應的文本片段標識,確定每個文本片段標識對應的出現次數;
確定對應的出現次數達到各目標字符的數量的目標文本片段標識。
可選的,所述方法還包括:
獲取目標文本數據對應的多個文本片段;
為每個文本片段分配文本片段片標識,將每個文本片段和文本片段標識對應添加到所述文本片段標識與文本片段的對應關系中;
對多個文本片段中的每個文本片段進行分詞處理,得到每個文本片段包含的各字符,統計多個文本片段包含的各字符分別對應的文本片段標識;
將多個文本片段包含的各字符和分別對應的文本片段標識對應添加到所述各字符與文本片段標識的對應關系中。
可選的,所述將每個字符和對應的文本片段標識對應添加到字符與文本片段標識的對應關系中,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州酷狗計算機科技有限公司,未經廣州酷狗計算機科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810160828.1/2.html,轉載請聲明來源鉆瓜專利網。





