[發明專利]內容搜索方法、裝置、設備和存儲介質有效
| 申請號: | 201910851956.5 | 申請日: | 2019-09-10 |
| 公開(公告)號: | CN110795544B | 公開(公告)日: | 2023-07-21 |
| 發明(設計)人: | 周輝陽 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 祝亞男 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 內容 搜索 方法 裝置 設備 存儲 介質 | ||
本申請提供了一種內容搜索方法、裝置、設備和存儲介質,涉及計算機技術領域。所述方法包括:獲取輸入搜索文本;根據輸入搜索文本在內容數據庫中進行召回,得到與輸入搜索文本匹配的第一候選搜索文本以及第一候選搜索文本對應的標注;根據標注對輸入搜索文本與第一候選搜索文本進行模糊匹配,得到第二候選搜索文本;根據目標內容和第二候選搜索文本對應的標注,對輸入搜索文本與第二候選搜索文本進行主謂一致性判斷,得到第三候選搜索文本;對輸入搜索文本與第三候選搜索文本進行句子模板一致性判斷,得到第一目標搜索文本。相比于相關技術中,本申請實施例提供的技術方案,采用模糊匹配,可以有效提高召回率,進一步提高了搜索結果的準確性。
技術領域
本申請實施例涉及計算機技術領域,特別涉及一種內容搜索方法、裝置、設備和存儲介質。
背景技術
應用程序可以獲取搜索框中的輸入搜索文本,該輸入搜索文本是用戶在搜索框中輸入的;之后,應用程序可以向用戶展示一些與該輸入搜索文本相關的搜索結果。
在相關技術中,在獲取到用戶輸入的輸入搜索文本之后,首先采用ES?(ElasticSearch)召回,得到與輸入搜索文本相似的一些候選搜索文本;之后將輸入搜索文本與候選搜索文本進行字符串精確匹配,若輸入搜索文本與目標候選搜索文本完全匹配,則將該目標候選搜索文本發送給服務器進行搜索,并將搜索結果返回給用戶。
在上述相關技術中,由于采用的是字符串精確匹配,輸入搜索文本與候選搜索文本中的字符必須完全一致,導致召回率不足,進一步導致搜索結果不夠準確。
發明內容
本申請實施例提供了一種內容搜索方法、裝置、設備和存儲介質,可用于解決相關技術中,召回率不足,搜索結果不夠準確的問題。所述技術方案如下:
一方面,本申請實施例提供了一種內容搜索方法,所述方法包括:
獲取輸入搜索文本;
根據所述輸入搜索文本在內容數據庫中進行召回,得到與所述輸入搜索文本匹配的第一候選搜索文本以及所述第一候選搜索文本對應的標注;
根據所述標注對所述輸入搜索文本與所述第一候選搜索文本進行模糊匹配,得到第二候選搜索文本,所述第二候選搜索文本包括所述第一候選搜索文本中與所述輸入搜索文本中的目標內容相似的標注所對應的搜索文本;
根據所述目標內容和所述第二候選搜索文本對應的標注,對所述輸入搜索文本與所述第二候選搜索文本進行主謂一致性判斷,得到第三候選搜索文本,所述第三候選搜索文本包括所述第二候選搜索文本中與所述輸入搜索文本主謂一致的搜索文本;
對所述輸入搜索文本與所述第三候選搜索文本進行句子模板一致性判斷,得到第一目標搜索文本,所述第一目標搜索文本用于進行內容搜索得到搜索結果。
另一方面,本申請實施例提供了一種內容搜索裝置,所述裝置包括:
文本獲取模塊,用于獲取輸入搜索文本;
文本召回模塊,用于根據所述輸入搜索文本在內容數據庫中進行召回,得到與所述輸入搜索文本匹配的第一候選搜索文本以及所述第一候選搜索文本對應的標注;
文本匹配模塊,用于根據所述標注對所述輸入搜索文本與所述第一候選搜索文本進行模糊匹配,得到第二候選搜索文本,所述第二候選搜索文本包括所述第一候選搜索文本中與所述輸入搜索文本中的目標內容相似的標注所對應的搜索文本;
主謂判斷模塊,用于根據所述目標內容和所述第二候選搜索文本對應的標注,對所述輸入搜索文本與所述第二候選搜索文本進行主謂一致性判斷,得到第三候選搜索文本,所述第三候選搜索文本包括所述第二候選搜索文本中與所述輸入搜索文本主謂一致的搜索文本;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910851956.5/2.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





