[發(fā)明專利]一種數(shù)據(jù)糾錯方法、裝置及服務器在審
| 申請?zhí)枺?/td> | 202011016203.1 | 申請日: | 2020-09-24 |
| 公開(公告)號: | CN112115232A | 公開(公告)日: | 2020-12-22 |
| 發(fā)明(設計)人: | 韓時通 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/338;G06F16/31;G06K9/62 |
| 代理公司: | 廣州三環(huán)專利商標代理有限公司 44202 | 代理人: | 熊永強;杜維 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數(shù)據(jù) 糾錯 方法 裝置 服務器 | ||
本發(fā)明實施例公開了一種數(shù)據(jù)糾錯方法、裝置及服務器,該方法包括:獲取用戶輸入的搜索詞;將所述搜索詞與預先創(chuàng)建的字典樹進行匹配,得到匹配結果,所述字典樹包括多個節(jié)點,所述多個節(jié)點中的每個節(jié)點用于表示參考詞列表中參考詞的一個分詞片段;若所述匹配結果指示所述搜索詞與所述字典樹不匹配,則獲取所述搜索詞的特征向量,并根據(jù)所述搜索詞的特征向量從所述參考詞列表包括的多個參考詞中確定出目標參考詞;將數(shù)據(jù)庫中與所述目標參考詞匹配的內容作為所述搜索詞的搜索結果。該方法可以準確地對搜索詞進行自動化糾錯,提升數(shù)據(jù)查詢的效率和準確度。
技術領域
本發(fā)明涉及計算機技術領域,尤其涉及一種數(shù)據(jù)糾錯方法、裝置及服務器。
背景技術
隨著互聯(lián)網(wǎng)技術的飛速發(fā)展,互聯(lián)網(wǎng)中的信息量也越來越大,如何能夠更有效地獲取其中所需的信息,已經(jīng)越來越受到人們的關注。大多數(shù)人是通過搜索引擎來完成他們信息的搜尋過程,但是當用戶在搜索引擎中輸入搜索詞進行查詢時,往往出于各種原因,總會存在輸入錯別字、多字或少字的情況,例如,用戶在存在著同音別字的情況時,將“公積金”輸入成“公雞金”,搜索引擎可能會發(fā)生返回的搜索結果不符合用戶預期的問題,此時用戶需要在大量的搜索結果頁面尋找所需信息,通常需要花費較多時間查閱搜索結果后發(fā)現(xiàn)搜索詞輸入錯誤,并嘗試更正搜索詞重新搜索,或者為了得到有效信息而不停地更換搜索詞,這種搜索方法無法達到智能化地查詢的目的,并且效率較低。
發(fā)明內容
有鑒于此,本發(fā)明實施例提供了一種數(shù)據(jù)糾錯方法,可以準確地對搜索詞進行自動化糾錯,提升數(shù)據(jù)查詢的效率和準確度。
第一方面,本發(fā)明實施例提供了一種數(shù)據(jù)糾錯方法,包括:
獲取用戶輸入的搜索詞;
將所述搜索詞與預先創(chuàng)建的字典樹進行匹配,得到匹配結果,所述字典樹包括多個節(jié)點,所述多個節(jié)點中的每個節(jié)點用于表示參考詞列表中參考詞的一個分詞片段;
若所述匹配結果指示所述搜索詞與所述字典樹不匹配,則獲取所述搜索詞的特征向量,并根據(jù)所述搜索詞的特征向量從所述參考詞列表包括的多個參考詞中確定出目標參考詞;
將數(shù)據(jù)庫中與所述目標參考詞匹配的內容作為所述搜索詞的搜索結果。
第二方面,本發(fā)明實施例提供了一種數(shù)據(jù)糾錯裝置,該裝置包括:
數(shù)據(jù)獲取模塊,用于獲取用戶輸入的搜索詞;
數(shù)據(jù)匹配模塊,用于將所述搜索詞與預先創(chuàng)建的字典樹進行匹配,得到匹配結果,所述字典樹包括多個節(jié)點,所述多個節(jié)點中的每個節(jié)點用于表示參考詞列表中參考詞的一個分詞片段;
數(shù)據(jù)確定模塊,用于若所述匹配結果指示所述搜索詞與所述字典樹不匹配,則獲取所述搜索詞的特征向量,并根據(jù)所述搜索詞的特征向量從所述參考詞列表包括的多個參考詞中確定出目標參考詞;
數(shù)據(jù)輸出模塊,用于將數(shù)據(jù)庫中與所述目標參考詞匹配的內容作為所述搜索詞的搜索結果。
第三方面,本申請實施例提供了一種服務器,該設備包括處理器、輸入設備、輸出設備和存儲器,所述處理器、輸入設備、輸出設備和存儲器相互連接,其中,所述存儲器用于存儲計算機程序,所述計算機程序包括程序指令,所述處理器被配置用于調用所述程序指令,用于執(zhí)行上述一種數(shù)據(jù)糾錯方法所涉及到的操作。
第四方面,本發(fā)明實施例提供一種計算機可讀存儲介質,存儲有計算機程序,所述處理器執(zhí)行上述一種數(shù)據(jù)糾錯方法所涉及的程序。
第五方面,本申請實施例提供了一種計算機程序產(chǎn)品或計算機程序,該計算機程序產(chǎn)品或計算機程序包括計算機指令,該計算機指令存儲在計算機可讀存儲介質中。計算機設備的處理器從計算機可讀存儲介質讀取該計算機指令,處理器執(zhí)行該計算機指令,使得該計算機設備執(zhí)行上述一種數(shù)據(jù)糾錯方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011016203.1/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結構
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





