[發明專利]搜索數據識別方法、裝置、電子設備以及計算機存儲介質在審
| 申請號: | 202011191952.8 | 申請日: | 2020-10-30 |
| 公開(公告)號: | CN112307183A | 公開(公告)日: | 2021-02-02 |
| 發明(設計)人: | 孫健 | 申請(專利權)人: | 北京金堤征信服務有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/9532;G06F40/247;G06F40/289 |
| 代理公司: | 北京康盛知識產權代理有限公司 11331 | 代理人: | 董娣 |
| 地址: | 100086 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 搜索 數據 識別 方法 裝置 電子設備 以及 計算機 存儲 介質 | ||
本公開是關于一種搜索數據識別方法、裝置、電子設備以及存儲介質。其中,該方法包括:響應于輸入的數據搜索請求,分析所述數據搜索請求中的搜索詞是否包括滿足預設特征條件的第一特征信息;根據預設分詞策略對所述第一特征信息進行分詞處理,并得到與第一特征信息對應的多組改寫候選詞;按照預設排序算法對所述多組改寫候選詞進行排序,得到排序后的候選搜索集合;根據所述候選搜索集合獲取第一召回結果數據。本公開可以提升搜索結果準確度,反饋更接近于用戶搜索預期的搜索結果。
技術領域
本公開涉及數據處理領域,具體而言,涉及一種搜索數據識別方法、裝置、電子設備以及計算機存儲介質。
背景技術
在信息搜索的應用場景中,用戶使用道聽途說或不熟悉的搜索詞進行信息搜索時,通常會使用拼音或者拼音的簡寫作為較大概率的搜索表達方式,如在搜索“天眼查”時由于不清楚具體詞語,則使用“tianyan查”進行檢索;或者在用戶急于輸入或拼音輸入法未提供出正確的候選詞時,用戶更偏向于直接錄入不確定的拼音或拼音簡寫或不完整的拼音片段,如“武漢喆靜wuz”(“武漢喆靜物資”)、“中國郵政速遞物流股份有限g”(“中國郵政速遞物流股份有限公司”)等。若通過類似具有拼音的不完整搜索表達,則難以識別真正的搜索用意,搜索結果多為無結果返回,或者返回結果不夠準確,偏離用戶預期真實結果。
因此,需要一種或多種方法解決上述問題。
需要說明的是,在上述背景技術部分公開的信息僅用于加強對本公開的背景的理解,因此可以包括不構成對本領域普通技術人員已知的現有技術的信息。
發明內容
本公開的目的在于提供一種搜索數據識別方法、裝置、電子設備以及計算機可讀存儲介質,進而至少在一定程度上克服由于相關技術的限制和缺陷而導致的一個或者多個問題。
根據本公開的一個方面,提供一種搜索數據識別方法,包括:
響應于輸入的數據搜索請求,分析所述數據搜索請求中的搜索詞是否包括滿足預設特征條件的第一特征信息;
當包括滿足預設特征條件的第一特征信息時,根據預設分詞策略對所述第一特征信息進行分詞處理,并得到與第一特征信息對應的多組改寫候選詞;
按照預設排序算法對所述多組改寫候選詞進行排序,得到排序后的候選搜索集合;
根據所述候選搜索集合獲取第一召回結果數據。
在本公開的一種示例性實施例中,所述分析所述數據搜索請求中的搜索詞是否包括滿足預設特征條件的第一特征信息,包括:
檢測所述數據搜索請求中的搜索詞是否包括拼音音節片段;
若所述搜索詞包括拼音音節片段,確定所述數據搜索請求中的搜索詞包括滿足預設特征條件的第一特征信息,所述拼音音節片段為所述第一特征信息。
在本公開的一種示例性實施例中,按照預設排序算法對所述多組改寫候選詞進行排序,得到排序后的候選搜索集合,包括:
根據預設排序算法計算各組改寫候選詞的評分,得到評分結果;
根據所述評分結果對所述改寫候選詞進行排序,得到排序后的候選搜索集合。
在本公開的一種示例性實施例中,按照預設排序算法對所述多組改寫候選詞進行排序,得到排序后的候選搜索集合,包括以下任意一項或多項:
判斷各改寫候選詞的獨立音節數量;根據獨立音節數量對各組改寫候選詞進行排序,得到排序后的候選搜索集合;
或者,
確定所述各改寫候選詞的音節前綴匹配度;根據音節前綴匹配度對各組改寫候選詞進行排序,得到排序后的候選搜索集合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京金堤征信服務有限公司,未經北京金堤征信服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011191952.8/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





