[發明專利]一種數據處理方法、裝置、設備及存儲介質在審
| 申請號: | 202110004255.5 | 申請日: | 2021-01-04 |
| 公開(公告)號: | CN113392309A | 公開(公告)日: | 2021-09-14 |
| 發明(設計)人: | 黃劍輝 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/9532 | 分類號: | G06F16/9532;G06F16/2453 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 熊永強;杜維 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據處理 方法 裝置 設備 存儲 介質 | ||
本申請實施例公開了一種數據處理方法、裝置、設備及存儲介質,該數據處理方法包括:獲取查詢數據,并從查詢數據中提取查詢特征序列;獲取特征匹配規則,特征匹配規則包括以下至少兩種:順序匹配規則、命中率匹配規則和緊密度匹配規則;按照特征匹配規則從數據庫中搜索與查詢特征序列相匹配的目標文檔。采用本申請實施例,可以從多個維度對查詢數據進行特征匹配,有效提高查詢數據的匹配準確率。
技術領域
本申請涉及計算機技術領域,尤其涉及智能搜索技術領域,具體涉及一種數據處理方法、一種數據處理裝置、一種數據處理設備以及一種計算機可讀存儲介質。
背景技術
搜索系統(例如百度、谷歌等搜索引擎)的本質是針對用戶給定的查詢數據(例如一個搜索字符、一個搜索詞或一個搜索語句),返回與查詢數據相關的文檔給用戶。目前,搜索系統常常會出現返回的文檔與查詢數據之間不匹配的情況,搜索體驗較差。因此,如何提高查詢數據的匹配準確率成為當前研究的熱點話題。
發明內容
本申請實施例提供了一種數據處理方法、裝置、設備及存儲介質,可以從多個維度對查詢數據進行特征匹配,有效提高查詢數據的匹配準確率。
一方面,本申請實施例提供一種數據處理方法,該數據處理方法包括:
獲取查詢數據,并從查詢數據中提取查詢特征序列,查詢特征序列包括N個特征數據,N為正整數;
獲取特征匹配規則,特征匹配規則包括以下至少兩種:順序匹配規則、命中率匹配規則和緊密度匹配規則;順序匹配規則用于指示按照N個特征數據在所述查詢特征序列中的排列順序進行依次匹配;命中率匹配規則用于指示按照命中數據與N個特征數據之間的數量比維度進行匹配;緊密度匹配規則用于指示按照命中數據之間的緊密度維度進行匹配;
按照特征匹配規則從數據庫中搜索與查詢特征序列相匹配的目標文檔;其中,命中數據是指目標文檔中與查詢特征序列中的特征數據相匹配的數據。
另一方面,本申請實施例提供一種數據處理裝置,該數據處理裝置包括:
獲取單元,用于獲取查詢數據,并從查詢數據中提取查詢特征序列,查詢特征序列包括N個特征數據,N為正整數;
獲取單元,還用于獲取特征匹配規則,特征匹配規則包括以下至少兩種:順序匹配規則、命中率匹配規則和緊密度匹配規則;順序匹配規則用于指示按照N個特征數據在所述查詢特征序列中的排列順序進行依次匹配;命中率匹配規則用于指示按照命中數據與N個特征數據之間的數量比維度進行匹配;緊密度匹配規則用于指示按照命中數據之間的緊密度維度進行匹配;
處理單元,用于按照特征匹配規則從數據庫中搜索與查詢特征序列相匹配的目標文檔;其中,命中數據是指目標文檔中與查詢特征序列中的特征數據相匹配的數據。
在一種實現方式中,獲取單元,具體用于:
對查詢數據進行拆分,得到N個特征數據,特征數據包括特征詞或特征字符;
按照N個特征數據在查詢數據中的排列順序對N個特征數據進行組合,形成查詢特征序列。
在一種實現方式中,處理單元,具體用于:
從數據庫中提取待匹配的第一文檔;
對第一文檔進行拆分,得到待匹配的數據集,數據集中包含多個數據;數據包括詞或字符;
按照特征匹配規則從數據集中獲取M個命中數據,命中數據是指數據集中與查詢特征序列中的特征數據相匹配的數據,M為正整數;
按照特征匹配規則計算M個命中數據與查詢特征序列中的N個特征數據之間的匹配度得分;
若匹配度得分高于閾值,則將第一文檔確定為與查詢特征序列相匹配的目標文檔。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110004255.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:駕駛輔助裝置
- 下一篇:一種數據處理方法、裝置、設備及介質





