[發(fā)明專(zhuān)利]輸入提示方法、裝置及字典樹(shù)模型的創(chuàng)建方法、裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201410169141.6 | 申請(qǐng)日: | 2014-04-24 |
| 公開(kāi)(公告)號(hào): | CN103914569B | 公開(kāi)(公告)日: | 2018-09-07 |
| 發(fā)明(設(shè)計(jì))人: | 柳陽(yáng);謝樸銳;任志杰;郭楚欽 | 申請(qǐng)(專(zhuān)利權(quán))人: | 百度在線(xiàn)網(wǎng)絡(luò)技術(shù)(北京)有限公司 |
| 主分類(lèi)號(hào): | G06F17/30 | 分類(lèi)號(hào): | G06F17/30 |
| 代理公司: | 北京清亦華知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 輸入 提示 方法 裝置 字典 模型 創(chuàng)建 | ||
本發(fā)明公開(kāi)了一種輸入提示方法,該方法包括:獲取輸入詞;對(duì)輸入詞進(jìn)行分拆以獲取N個(gè)分拆詞,其中,N為正整數(shù);根據(jù)N個(gè)分拆詞分別查詢(xún)預(yù)設(shè)的字典樹(shù)模型以分別獲取N個(gè)提示結(jié)果集合;以及根據(jù)N個(gè)提示結(jié)果集合生成最終的提示結(jié)果。本發(fā)明實(shí)施例的輸入提示方法通過(guò)對(duì)輸入詞進(jìn)行分拆擴(kuò)展以獲取輸入詞的前綴分拆詞、中間分拆詞等,并通過(guò)前綴分拆詞、中間分拆詞查詢(xún)預(yù)設(shè)的字典樹(shù)模型,獲得分別與前綴分拆詞、中間分拆詞匹配的提示結(jié)果,提高了提示的精準(zhǔn)性,并且通過(guò)融入輸入詞的語(yǔ)境處理以及將輸入詞的分切粒度降為最小,增大了檢索匹配時(shí)的可能性,提升了用戶(hù)體驗(yàn)。本發(fā)明還公開(kāi)了一種輸入提示裝置以及一種字典樹(shù)模型的創(chuàng)建方法和裝置。
技術(shù)領(lǐng)域
本發(fā)明涉及搜索技術(shù)領(lǐng)域,尤其涉及一種輸入提示方法和裝置以及字典樹(shù)模型的創(chuàng)建方法和裝置。
背景技術(shù)
目前,在國(guó)內(nèi)的搜索領(lǐng)域中,例如網(wǎng)頁(yè)搜索和垂搜,如果搜索詞輸入提示詞庫(kù)在十萬(wàn)級(jí)別以上,基本上都是依賴(lài)于Trie樹(shù)(一種基于內(nèi)存的搜索算法),其索引的過(guò)程是建樹(shù),且檢索過(guò)程是對(duì)樹(shù)的遍歷。然而具體是怎么建樹(shù)、怎么遍歷,不同的設(shè)計(jì)者會(huì)根據(jù)自身數(shù)據(jù)特定,制定不同的方法。
目前,國(guó)內(nèi)基于漢語(yǔ)的Auto Complete算法,基本上都是先將詞的每個(gè)漢字字符依次插入到Trie樹(shù)的從根到葉子的每個(gè)節(jié)點(diǎn)中,然后將漢字轉(zhuǎn)拼音再次建樹(shù),搜索時(shí)就是從根節(jié)點(diǎn)到葉子節(jié)點(diǎn)依次遍歷。這種方法可以解決大部分的輸入搜索詞提示問(wèn)題。
但是,如果用戶(hù)輸入的搜索詞不是詞庫(kù)中任何詞的前綴,那么這種依賴(lài)Trie樹(shù)的方法就不可行了;或者說(shuō)提示了不存在的詞條,例如,如圖1所示,搜索詞“通天帝國(guó)之”召回了“通天帝國(guó)之狄仁杰”,而正確并存在的詞條是“狄仁杰之通天帝國(guó)”,而這樣是一種不嚴(yán)謹(jǐn)?shù)淖龇ǎ瑥亩档土怂阉髟~提示的精準(zhǔn)性,用戶(hù)體驗(yàn)差。
發(fā)明內(nèi)容
本發(fā)明旨在至少在一定程度上解決上述的技術(shù)缺陷之一。
為此,本發(fā)明的第一個(gè)目的在于提出一種輸入提示方法。該方法通過(guò)對(duì)輸入詞進(jìn)行分拆擴(kuò)展,并根據(jù)分拆后輸入詞查詢(xún)預(yù)設(shè)的字典樹(shù)模型以獲得提示結(jié)果,提高了提示的精準(zhǔn)性,并且通過(guò)融入輸入詞的語(yǔ)境處理以及將輸入詞的分切粒度降為最小,增大了檢索匹配時(shí)的可能性,提升了用戶(hù)體驗(yàn)。
本發(fā)明的第二個(gè)目的在于提出一種字典樹(shù)模型的創(chuàng)建方法。
本發(fā)明的第三個(gè)目的在于提出一種輸入提示裝置。
本發(fā)明的第四個(gè)目的在于提出一種字典樹(shù)模型的創(chuàng)建裝置。
為了實(shí)現(xiàn)上述目的,本發(fā)明第一方面實(shí)施例的輸入提示方法,包括:獲取輸入詞;對(duì)所述輸入詞進(jìn)行分拆以獲取N個(gè)分拆詞,其中,N為正整數(shù);根據(jù)所述N個(gè)分拆詞分別查詢(xún)預(yù)設(shè)的字典樹(shù)模型以分別獲取N個(gè)提示結(jié)果集合;以及根據(jù)所述N個(gè)提示結(jié)果集合生成最終的提示結(jié)果。
本發(fā)明實(shí)施例的輸入提示方法,可對(duì)獲取的輸入詞進(jìn)行分拆以獲取N個(gè)分拆詞,并根據(jù)該N個(gè)分拆詞分別查詢(xún)預(yù)設(shè)的字典樹(shù)模型以分別獲取N個(gè)提示結(jié)果集合,之后可對(duì)該N個(gè)提示結(jié)果集合進(jìn)行合并及去重以生成最終的提示結(jié)果,通過(guò)對(duì)輸入詞進(jìn)行分拆擴(kuò)展,可獲取輸入詞的前綴分拆詞、中間分拆詞等,這樣通過(guò)前綴分拆詞、中間分拆詞查詢(xún)預(yù)設(shè)的字典樹(shù)模型,可獲得前綴分拆詞匹配的提示結(jié)果、中間分拆詞匹配的提示結(jié)果,提高了自動(dòng)提示的精準(zhǔn)性,并且,通過(guò)融入輸入詞的語(yǔ)境處理,并將輸入詞的分切粒度降為最小,增大了檢索匹配時(shí)的可能性,提升了用戶(hù)體驗(yàn)。
為了實(shí)現(xiàn)上述目的,本發(fā)明第二方面實(shí)施例的字典樹(shù)模型的創(chuàng)建方法,包括:獲取多個(gè)樣本詞;根據(jù)訪問(wèn)熱度對(duì)所述多個(gè)樣本詞進(jìn)行排序,并分別對(duì)排序后的多個(gè)樣本詞作為多個(gè)主體詞;分別根據(jù)所述多個(gè)主體詞生成每個(gè)主體詞對(duì)應(yīng)的相關(guān)詞;以及根據(jù)所述多個(gè)主體詞和所述每個(gè)主體詞對(duì)應(yīng)的相關(guān)詞創(chuàng)建字典樹(shù)模型。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于百度在線(xiàn)網(wǎng)絡(luò)技術(shù)(北京)有限公司,未經(jīng)百度在線(xiàn)網(wǎng)絡(luò)技術(shù)(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410169141.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:一種基于網(wǎng)格分割的三維模型檢索方法
- 下一篇:蔬菜的加工裝置
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線(xiàn)程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 光源裝置、照明裝置、液晶裝置和電子裝置
- 預(yù)測(cè)裝置、編輯裝置、逆預(yù)測(cè)裝置、解碼裝置及運(yùn)算裝置
- 圖像形成裝置、定影裝置、遮光裝置以及保持裝置
- 打印裝置、讀取裝置、復(fù)合裝置以及打印裝置、讀取裝置、復(fù)合裝置的控制方法
- 電子裝置、光盤(pán)裝置、顯示裝置和攝像裝置
- 光源裝置、照明裝置、曝光裝置和裝置制造方法
- 用戶(hù)裝置、裝置對(duì)裝置用戶(hù)裝置、后端裝置及其定位方法
- 遙控裝置、通信裝置、可變裝置及照明裝置
- 透鏡裝置、攝像裝置、處理裝置和相機(jī)裝置
- 抖動(dòng)校正裝置、驅(qū)動(dòng)裝置、成像裝置、和電子裝置





