[發(fā)明專利]基于用戶習(xí)慣性輸入錯(cuò)誤的查詢糾錯(cuò)方法和裝置無(wú)效
| 申請(qǐng)?zhí)枺?/td> | 201210025834.9 | 申請(qǐng)日: | 2012-02-06 |
| 公開(公告)號(hào): | CN103246576A | 公開(公告)日: | 2013-08-14 |
| 發(fā)明(設(shè)計(jì))人: | 李超;宋國(guó)龍 | 申請(qǐng)(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號(hào): | G06F11/07 | 分類號(hào): | G06F11/07;G06F17/30 |
| 代理公司: | 北京中博世達(dá)專利商標(biāo)代理有限公司 11274 | 代理人: | 申健 |
| 地址: | 518000 廣東省深*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 用戶 習(xí)慣性 輸入 錯(cuò)誤 查詢 糾錯(cuò) 方法 裝置 | ||
1.一種基于用戶習(xí)慣性輸入錯(cuò)誤的查詢糾錯(cuò)方法,其特征在于,包括:
從搜索引擎日志中選取待判定查詢串,所述待判定查詢串為使用頻率大于預(yù)設(shè)的使用頻率閾值的查詢串;
從搜索引擎日志中搜索與所述待判定查詢串相似的比對(duì)查詢串,并將每個(gè)所述待判定查詢串與其相應(yīng)的比對(duì)查詢串綁定為一個(gè)查詢串組;
按照預(yù)設(shè)的過濾規(guī)則過濾所述查詢串組;
將過濾后的查詢串組與標(biāo)準(zhǔn)詞庫(kù)中的詞語(yǔ)進(jìn)行對(duì)比,從所述待判定查詢串與比對(duì)查詢串中選擇出正確的查詢串。
2.根據(jù)權(quán)利要求1所述的基于用戶習(xí)慣性輸入錯(cuò)誤的查詢糾錯(cuò)方法,其特征在于,所述預(yù)設(shè)的過濾規(guī)則,包括:
判斷查詢串組中的查詢串是否為人名或者地名,若所述查詢串組中存在一個(gè)為人名或者地名的查詢串,則過濾掉該查詢串組。
3.根據(jù)權(quán)利要求1所述的基于用戶習(xí)慣性輸入錯(cuò)誤的查詢糾錯(cuò)方法,其特征在于,所述預(yù)設(shè)的過濾規(guī)則,包括:
判斷查詢串組被其它查詢串組所包含的次數(shù)是否小于預(yù)設(shè)的數(shù)量閾值,若小于預(yù)設(shè)的數(shù)量閾值,則過濾掉該查詢串組。
4.根據(jù)權(quán)利要求1所述的基于用戶習(xí)慣性輸入錯(cuò)誤的查詢糾錯(cuò)方法,其特征在于,所述相似的比對(duì)查詢串包括字形相似度大于預(yù)設(shè)值的查詢串。
5.根據(jù)權(quán)利要求1所述的基于用戶習(xí)慣性輸入錯(cuò)誤的查詢糾錯(cuò)方法,其特征在于,所述相似的比對(duì)查詢串包括具有與所述待判定查詢串相同的注音結(jié)果的查詢串。
6.一種基于用戶習(xí)慣性輸入錯(cuò)誤的查詢糾錯(cuò)裝置,其特征在于,包括:
選取模塊,用于從搜索引擎日志中選取待判定查詢串,所述待判定查詢串為使用頻率大于預(yù)設(shè)的使用頻率閾值的查詢串;
查詢串組建立模塊,用于從搜索引擎日志中搜索與所述待判定查詢串相似的比對(duì)查詢串,并將每個(gè)所述待判定查詢串與其相應(yīng)的比對(duì)查詢串綁定為一個(gè)查詢串組;
過濾模塊,用于按照預(yù)設(shè)的過濾規(guī)則過濾所述查詢串組;
判別模塊,用于將過濾后的查詢串組與標(biāo)準(zhǔn)詞庫(kù)中的詞語(yǔ)進(jìn)行對(duì)比,從所述待判定查詢串與比對(duì)查詢串中選擇出正確的查詢串。
7.根據(jù)權(quán)利要求6所述的基于用戶習(xí)慣性輸入錯(cuò)誤的查詢糾錯(cuò)裝置,其特征在于,所述預(yù)設(shè)的過濾規(guī)則,包括:
判斷查詢串組中的查詢串是否為人名或者地名,若所述查詢串組中存在一個(gè)為人名或者地名的查詢串,則過濾掉該查詢串組。
8.根據(jù)權(quán)利要求6所述的基于用戶習(xí)慣性輸入錯(cuò)誤的查詢糾錯(cuò)裝置,其特征在于,所述預(yù)設(shè)的過濾規(guī)則,包括:
判斷查詢串組被其它查詢串組所包含的次數(shù)是否小于預(yù)設(shè)的數(shù)量閾值,若小于預(yù)設(shè)的數(shù)量閾值,則過濾掉該查詢串組。
9.根據(jù)權(quán)利要求6所述的基于用戶習(xí)慣性輸入錯(cuò)誤的查詢糾錯(cuò)裝置,其特征在于,所述相似的比對(duì)查詢串包括字形相似度大于預(yù)設(shè)值的查詢串。
10.根據(jù)權(quán)利要求6所述的基于用戶習(xí)慣性輸入錯(cuò)誤的查詢糾錯(cuò)裝置,其特征在于,所述相似的比對(duì)查詢串包括具有與所述待判定查詢串相同的注音結(jié)果的查詢串。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210025834.9/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F11-00 錯(cuò)誤檢測(cè);錯(cuò)誤校正;監(jiān)控
G06F11-07 .響應(yīng)錯(cuò)誤的產(chǎn)生,例如,容錯(cuò)
G06F11-22 .在準(zhǔn)備運(yùn)算或者在空閑時(shí)間期間內(nèi),通過測(cè)試作故障硬件的檢測(cè)或定位
G06F11-28 .借助于檢驗(yàn)標(biāo)準(zhǔn)程序或通過處理作錯(cuò)誤檢測(cè)、錯(cuò)誤校正或監(jiān)控
G06F11-30 .監(jiān)控
G06F11-36 .通過軟件的測(cè)試或調(diào)試防止錯(cuò)誤





