[發(fā)明專利]提供查詢建議的方法、裝置、電子設(shè)備和存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202110547368.X | 申請日: | 2021-05-19 |
| 公開(公告)號: | CN113239258B | 公開(公告)日: | 2023-06-27 |
| 發(fā)明(設(shè)計)人: | 周麗芳;張謙;陳國梁;王崗 | 申請(專利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G06F16/953 | 分類號: | G06F16/953 |
| 代理公司: | 北京市漢坤律師事務(wù)所 11602 | 代理人: | 姜浩然;吳麗麗 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 提供 查詢 建議 方法 裝置 電子設(shè)備 存儲 介質(zhì) | ||
1.一種提供查詢建議的方法,包括:
獲取用戶輸入的第一字符串;
使用所述第一字符串作為索引查詢預配置的數(shù)據(jù)庫,其中,所述數(shù)據(jù)庫是倒排索引數(shù)據(jù)庫,在所述數(shù)據(jù)庫中,以所述第一字符串作為索引存儲第二字符串,所述第一字符串是所述第二字符串或所述第二字符串的一部分在被輸入時的中間字符序列;并且
輸出所述第二字符串作為查詢建議,
其中,所述數(shù)據(jù)庫通過如下步驟進行預配置:
處理所述第二字符串以獲得一個或多個片段字符串,所述一個或多個片段字符串中的每個片段字符串是所述第二字符串或所述第二字符串的一部分在被輸入時的中間字符序列,并且所述一個或多個片段字符串包括所述第一字符串;以及
針對所述一個或多個片段字符串中的每個片段字符串,將該片段字符串作為索引存儲所述第二字符串,
其中,所述第二字符串是漢字字符串,并且其中,處理所述第二字符串以獲得一個或多個片段字符串包括:
獲取所述第二字符串的一個或多個漢字子字符串,每個漢字子字符串包括所述第二字符串中的連續(xù)排列的一個或多個漢字字符;
針對所述一個或多個漢字子字符串中的每個漢字子字符串,通過將該漢字子字符串中的至少一個漢字替換成對應(yīng)的拼音表示,生成一個或多個混合子字符串;以及
使用所生成的漢字子字符串和混合子字符串中的一個或多個作為針對所述第二字符串的所述一個或多個片段字符串,
其中,針對所述一個或多個漢字子字符串中的每個漢字子字符串,生成一個或多個混合子字符串包括:
將該漢字子字符串的前k個字符作為第一拼接部分,其中k是非負整數(shù)并且k≤n,n是該漢字子字符串的字符長度;
生成一個或多個第二拼接部分,所述一個或多個第二拼接部分中的每個是該漢字子字符串的第k+1到第n-1個字符的全拼或者首字母按順序形成的字符串;
生成一個或多個第三拼接部分,所述一個或多個第三拼接部分中的每個是該漢字子字符串的第n個字符的全拼的左側(cè)有序子集;
生成所述一個或多個混合子字符串,每個混合子字符串是第一拼接部分、一個或多個第二拼接部分中的一個第二拼接部分以及一個或多個第三拼接部分中的一個第三拼接部分按順序拼接而形成的字符串。
2.根據(jù)權(quán)利要求1所述的方法,其中,獲取所述第二字符串的一個或多個漢字子字符串包括:
生成所述第二字符串的一個或多個右側(cè)子串,每個右側(cè)子串是所述第二字符串中的連續(xù)排列的子字符串,并且所述右側(cè)子串的最后一個字符與所述第二字符串的最后一個字符相同;并且
針對每個右側(cè)子串,生成該右側(cè)子串的左側(cè)子串作為針對所述第二字符串的子字符串,每個左側(cè)子串是所述右側(cè)子串中的連續(xù)排列的子字符串,并且所述左側(cè)子串的第一個字符與該右側(cè)子串的第一個字符相同。
3.根據(jù)權(quán)利要求1或2所述的方法,其中,所述數(shù)據(jù)庫還通過如下步驟進行預配置:
在處理所述第二字符串以獲得一個或多個片段字符串之后,針對所述一個或多個片段字符串中的每個片段字符串,確定該片段字符串與所述第二字符串之間的關(guān)聯(lián)值,并且
將該片段字符串作為索引存儲所述第二字符串包括:將該片段字符串作為索引,存儲所述第二字符串與對應(yīng)的關(guān)聯(lián)值;
并且其中,輸出所述第二字符串作為查詢建議包括:
響應(yīng)于確定所述第一字符串與所述第二字符串之間的關(guān)聯(lián)值滿足閾值條件,使得向所述用戶輸出所述第二字符串。
4.根據(jù)權(quán)利要求3所述的方法,其中,確定該片段字符串與所述第二字符串之間的關(guān)聯(lián)值包括:
確定該片段字符串相對于所述第二字符串的偏移度,偏移度指示在所述第二字符串中的、與該片段字符串中的第一個字符對應(yīng)的字符的位置;
確定該片段字符串與所述第二字符串的重合度,重合度指示該片段字符串與所述第二字符串的內(nèi)容匹配程度;并且
基于所述偏移度與所述重合度確定該片段字符串與所述第二字符串之間的所述關(guān)聯(lián)值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110547368.X/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信息提供系統(tǒng)、信息提供方法、信息提供設(shè)備
- 信息提供裝置、信息提供系統(tǒng)
- 游戲提供系統(tǒng)、游戲提供程序和游戲提供方法
- 游戲提供系統(tǒng)、游戲提供程序和游戲提供方法
- 信息提供方法、信息提供裝置、信息提供系統(tǒng)及信息提供程序
- 動作信息提供裝置、提供系統(tǒng)以及提供方法
- 提供裝置、提供方法、提供系統(tǒng)以及存儲介質(zhì)
- 提供裝置、提供方法、存儲介質(zhì)以及提供系統(tǒng)
- 提供裝置、提供方法、存儲介質(zhì)以及提供系統(tǒng)
- 內(nèi)容提供裝置、內(nèi)容提供方法以及內(nèi)容提供系統(tǒng)





