[發(fā)明專利]一種提供搜索聯(lián)想詞的方法和裝置在審
| 申請?zhí)枺?/td> | 202010437810.9 | 申請日: | 2020-05-21 |
| 公開(公告)號: | CN113704387A | 公開(公告)日: | 2021-11-26 |
| 發(fā)明(設(shè)計)人: | 何剛;楊森 | 申請(專利權(quán))人: | 北京沃東天駿信息技術(shù)有限公司;北京京東世紀(jì)貿(mào)易有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/335;G06F16/9535;G06Q30/06 |
| 代理公司: | 中原信達(dá)知識產(chǎn)權(quán)代理有限責(zé)任公司 11219 | 代理人: | 李陽;趙迪 |
| 地址: | 100176 北京市北京經(jīng)濟(jì)技術(shù)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 提供 搜索 聯(lián)想 方法 裝置 | ||
本發(fā)明公開了一種提供搜索聯(lián)想詞的方法和裝置,涉及計算機技術(shù)領(lǐng)域。該方法的一具體實施方式包括:獲取用戶輸入的搜索關(guān)鍵詞,使用搜索關(guān)鍵詞在設(shè)定的語料庫中進(jìn)行檢索,得到用于聯(lián)想搜索關(guān)鍵詞的候選文本集;其中,語料庫包括語料文本和為語料文本統(tǒng)計出的多個評價參數(shù)的參數(shù)值;根據(jù)參數(shù)值,為候選文本集的候選文本計算多個評價參數(shù)的基準(zhǔn)評價值,將多個基準(zhǔn)評價值加權(quán)求和,得到候選文本的綜合評價值;將候選文本按照綜合評價值進(jìn)行排序,根據(jù)排序結(jié)果選取目標(biāo)候選文本作為搜索關(guān)鍵詞的聯(lián)想詞。該方法使用多個評價參數(shù)對候選文本進(jìn)行綜合評價,進(jìn)而選取綜合評價高的候選文本作為聯(lián)想詞,實現(xiàn)了更細(xì)粒度的輸入聯(lián)想,使得聯(lián)想結(jié)果更加準(zhǔn)確。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機技術(shù)領(lǐng)域,尤其涉及一種提供搜索聯(lián)想詞的方法和裝置。
背景技術(shù)
隨著互聯(lián)網(wǎng)的蓬勃發(fā)展,越來越多的服務(wù)通過互聯(lián)網(wǎng)提供和消費,在線客服也迅速發(fā)展起來。為了提升用戶的輸入效率,同時也起到一定的引導(dǎo)作用,在線客服窗口一般會提供輸入聯(lián)想機制,該機制可以在用戶輸入部分關(guān)鍵字時,自動聯(lián)想出用戶可能需要輸入的咨詢內(nèi)容,用戶點擊即可完成完整咨詢內(nèi)容的輸入。
現(xiàn)有的在線客服在根據(jù)用戶輸入的部分關(guān)鍵字聯(lián)想咨詢內(nèi)容時,通常基于過去一段時間的用戶咨詢記錄,挖掘出用戶咨詢的高頻問題,使用這些高頻問題構(gòu)建語料庫,然后通過語料庫匹配用戶輸入的關(guān)鍵字,將匹配出的高頻問題按照頻率高低排序,頻率越高則認(rèn)為是最可能被再次咨詢的問題,并推送給用戶。
在實現(xiàn)本發(fā)明過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)中至少存在如下問題:
輸入聯(lián)想的粒度較粗,聯(lián)想結(jié)果準(zhǔn)確度低,無法滿足實際需求。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實施例提供一種提供搜索聯(lián)想詞的方法和裝置,基于搜索關(guān)鍵詞確定候選文本集后,使用多個評價參數(shù)對候選文本進(jìn)行綜合評價,進(jìn)而選取綜合評價高的候選文本作為聯(lián)想詞,實現(xiàn)了更細(xì)粒度的輸入聯(lián)想,使得聯(lián)想結(jié)果更加準(zhǔn)確,更加貼近用戶想輸入的內(nèi)容。
為實現(xiàn)上述目的,根據(jù)本發(fā)明實施例的一個方面,提供了一種提供搜索聯(lián)想詞的方法。
本發(fā)明實施例的一種提供搜索聯(lián)想詞的方法,包括:獲取用戶輸入的搜索關(guān)鍵詞,使用所述搜索關(guān)鍵詞在設(shè)定的語料庫中進(jìn)行檢索,得到用于聯(lián)想所述搜索關(guān)鍵詞的候選文本集;其中,所述語料庫包括語料文本和為所述語料文本統(tǒng)計出的多個評價參數(shù)的參數(shù)值;根據(jù)所述參數(shù)值,為所述候選文本集的候選文本計算所述多個評價參數(shù)的基準(zhǔn)評價值,將多個所述基準(zhǔn)評價值加權(quán)求和,得到所述候選文本的綜合評價值;將所述候選文本按照所述綜合評價值進(jìn)行排序,根據(jù)排序結(jié)果選取目標(biāo)候選文本作為所述搜索關(guān)鍵詞的聯(lián)想詞。
可選地,所述評價參數(shù)為下列任意多個的組合:文本出現(xiàn)頻次、文本生成時間、物品品類、供應(yīng)方標(biāo)識、搜索入口;所述方法還包括:根據(jù)歷史搜索記錄,計算所述語料文本的文本出現(xiàn)頻次;根據(jù)所述歷史搜索記錄,確定所述語料文本的文本生成時間、所述語料文本所對應(yīng)物品的物品品類和供應(yīng)方標(biāo)識、以及搜索入口。
可選地,根據(jù)所述參數(shù)值,為所述候選文本集的候選文本計算所述文本出現(xiàn)頻次的基準(zhǔn)評價值,包括:根據(jù)所述候選文本集中候選文本的文本出現(xiàn)頻次,確定最大文本出現(xiàn)頻次;根據(jù)所述最大文本出現(xiàn)頻次,對所述候選文本的文本出現(xiàn)頻次進(jìn)行歸一化處理,得到所述候選文本的文本出現(xiàn)頻次的基準(zhǔn)評價值。
可選地,根據(jù)所述參數(shù)值,為所述候選文本集的候選文本計算所述文本生成時間的基準(zhǔn)評價值,包括:根據(jù)所述候選文本集中候選文本的文本生成時間,確定最大文本生成時間和最小文本生成時間;根據(jù)所述最大文本生成時間和所述最小文本生成時間,對所述候選文本的文本生成時間進(jìn)行歸一化處理,得到所述候選文本的文本生成時間的基準(zhǔn)評價值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京沃東天駿信息技術(shù)有限公司;北京京東世紀(jì)貿(mào)易有限公司,未經(jīng)北京沃東天駿信息技術(shù)有限公司;北京京東世紀(jì)貿(mào)易有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010437810.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:聯(lián)合傳輸方法及裝置
- 下一篇:一種建立通信連接的方法及裝置
- 信息提供系統(tǒng)、信息提供方法、信息提供設(shè)備
- 信息提供裝置、信息提供系統(tǒng)
- 游戲提供系統(tǒng)、游戲提供程序和游戲提供方法
- 游戲提供系統(tǒng)、游戲提供程序和游戲提供方法
- 信息提供方法、信息提供裝置、信息提供系統(tǒng)及信息提供程序
- 動作信息提供裝置、提供系統(tǒng)以及提供方法
- 提供裝置、提供方法、提供系統(tǒng)以及存儲介質(zhì)
- 提供裝置、提供方法、存儲介質(zhì)以及提供系統(tǒng)
- 提供裝置、提供方法、存儲介質(zhì)以及提供系統(tǒng)
- 內(nèi)容提供裝置、內(nèi)容提供方法以及內(nèi)容提供系統(tǒng)





