[發(fā)明專利]搜索方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202010555041.2 | 申請(qǐng)日: | 2020-06-17 |
| 公開(kāi)(公告)號(hào): | CN111708911B | 公開(kāi)(公告)日: | 2022-06-24 |
| 發(fā)明(設(shè)計(jì))人: | 王鑫宇;張永華 | 申請(qǐng)(專利權(quán))人: | 北京字節(jié)跳動(dòng)網(wǎng)絡(luò)技術(shù)有限公司 |
| 主分類號(hào): | G06F16/732 | 分類號(hào): | G06F16/732 |
| 代理公司: | 北京市立方律師事務(wù)所 11330 | 代理人: | 張?bào)銓?/td> |
| 地址: | 100041 北京市石景山區(qū)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 搜索 方法 裝置 電子設(shè)備 計(jì)算機(jī) 可讀 存儲(chǔ) 介質(zhì) | ||
1.一種搜索方法,其特征在于,包括:
獲取搜索請(qǐng)求,所述搜索請(qǐng)求包括第一語(yǔ)種的第一搜索關(guān)鍵詞;
對(duì)所述第一搜索關(guān)鍵詞進(jìn)行分詞處理,得到至少一個(gè)分詞;
當(dāng)分詞的數(shù)量超過(guò)分詞數(shù)量閾值時(shí),獲取各個(gè)分詞的詞頻;所述詞頻為所述分詞在預(yù)設(shè)的多語(yǔ)種詞庫(kù)中出現(xiàn)的次數(shù);
將各個(gè)分詞中詞頻最低的預(yù)定分詞數(shù)量的分詞作為各個(gè)第一目標(biāo)分詞,計(jì)算各個(gè)第一目標(biāo)分詞的詞頻的乘積,得到計(jì)算結(jié)果;
當(dāng)所述計(jì)算結(jié)果小于乘積閾值時(shí),將各個(gè)第一目標(biāo)分詞中詞頻最小的第一目標(biāo)分詞去除,得到各個(gè)第二目標(biāo)分詞;
將各個(gè)第二目標(biāo)分詞分別作為當(dāng)前第一目標(biāo)分詞,重復(fù)執(zhí)行計(jì)算各個(gè)第一目標(biāo)分詞的詞頻的乘積,得到計(jì)算結(jié)果,當(dāng)所述計(jì)算結(jié)果小于乘積閾值時(shí),將各個(gè)第一目標(biāo)分詞中詞頻最小的第一目標(biāo)分詞去除,得到各個(gè)第二目標(biāo)分詞的步驟,直至當(dāng)前的計(jì)算結(jié)果不小于乘積閾值,采用多個(gè)第二目標(biāo)分詞中的至少一個(gè)搜索得到對(duì)應(yīng)的第一搜索結(jié)果;
當(dāng)所述第一搜索結(jié)果的數(shù)量小于數(shù)量閾值時(shí),基于預(yù)設(shè)規(guī)則獲取與所述第一搜索關(guān)鍵詞對(duì)應(yīng)的至少一個(gè)第二語(yǔ)種的第二搜索關(guān)鍵詞;
基于各個(gè)第二搜索關(guān)鍵詞搜索得到各自對(duì)應(yīng)的第二搜索結(jié)果;
將所述第一搜索結(jié)果和各個(gè)第二搜索結(jié)果中的至少一種作為搜索結(jié)果列表;
展示所述搜索結(jié)果列表。
2.根據(jù)權(quán)利要求1所述的搜索方法,其特征在于,還包括:
當(dāng)所述第一搜索結(jié)果的數(shù)量不小于所述數(shù)量閾值時(shí),將所述第一搜索結(jié)果作為所述搜索結(jié)果列表。
3.根據(jù)權(quán)利要求1所述的搜索方法,其特征在于,基于預(yù)設(shè)規(guī)則獲取與所述第一搜索關(guān)鍵詞對(duì)應(yīng)的至少一個(gè)第二語(yǔ)種的第二搜索關(guān)鍵詞,包括:
將所述第一搜索關(guān)鍵詞在預(yù)設(shè)的多語(yǔ)種詞庫(kù)中進(jìn)行查詢匹配,得到與所述第一搜索關(guān)鍵詞匹配的至少一個(gè)第一語(yǔ)種關(guān)鍵詞,并得到與各個(gè)第一語(yǔ)種關(guān)鍵詞各自具有關(guān)聯(lián)關(guān)系的各個(gè)第二語(yǔ)種關(guān)鍵詞。
4.根據(jù)權(quán)利要求1或3所述的搜索方法,其特征在于,基于各個(gè)第二搜索關(guān)鍵詞搜索得到各自對(duì)應(yīng)的第二搜索結(jié)果,包括:
獲取各個(gè)第二語(yǔ)種關(guān)鍵詞各自對(duì)應(yīng)的搜索結(jié)果的召回?cái)?shù)量;所述搜索結(jié)果的召回?cái)?shù)量為依據(jù)任一第二語(yǔ)種關(guān)鍵詞搜索得到的搜索結(jié)果的數(shù)量;
基于各個(gè)召回?cái)?shù)量和召回?cái)?shù)量閾值確定出至少一個(gè)目標(biāo)第二語(yǔ)種關(guān)鍵詞;
從各個(gè)目標(biāo)第二語(yǔ)種關(guān)鍵詞各自對(duì)應(yīng)的搜索結(jié)果的集合中確定出所述召回?cái)?shù)量閾值的第二搜索結(jié)果。
5.根據(jù)權(quán)利要求4所述的搜索方法,其特征在于,所述基于各個(gè)召回?cái)?shù)量和召回?cái)?shù)量閾值確定出至少一個(gè)目標(biāo)第二語(yǔ)種關(guān)鍵詞,包括:
基于各個(gè)召回?cái)?shù)量對(duì)各個(gè)第二語(yǔ)種關(guān)鍵詞進(jìn)行升序排序,得到排序后的各個(gè)第二語(yǔ)種關(guān)鍵詞;
將排序第一的第二語(yǔ)種關(guān)鍵詞作為檢測(cè)對(duì)象,并確定出所述檢測(cè)對(duì)象的總召回?cái)?shù)量;
判斷所述總召回?cái)?shù)量是否超過(guò)所述召回?cái)?shù)量閾值;
若否,則將所述檢測(cè)對(duì)象和所述檢測(cè)對(duì)象排序下一位的第二語(yǔ)種關(guān)鍵詞同時(shí)作為當(dāng)前的檢測(cè)對(duì)象,重復(fù)執(zhí)行確定出所述檢測(cè)對(duì)象的總召回?cái)?shù)量,判斷所述總召回?cái)?shù)量是否超過(guò)所述召回?cái)?shù)量閾值的步驟,直至所述總召回?cái)?shù)量超過(guò)所述召回?cái)?shù)量閾值時(shí),將當(dāng)前的檢測(cè)對(duì)象對(duì)應(yīng)的至少一個(gè)第二語(yǔ)種關(guān)鍵詞作為目標(biāo)第二語(yǔ)種關(guān)鍵詞。
6.根據(jù)權(quán)利要求4所述的搜索方法,其特征在于,所述從各個(gè)目標(biāo)第二語(yǔ)種關(guān)鍵詞各自對(duì)應(yīng)的搜索結(jié)果的集合中確定出所述召回?cái)?shù)量閾值的第二搜索結(jié)果,包括:
基于各個(gè)目標(biāo)第二語(yǔ)種關(guān)鍵詞的升序排序,以及每個(gè)目標(biāo)第二語(yǔ)種關(guān)鍵詞對(duì)應(yīng)的搜索結(jié)果的預(yù)設(shè)排序,對(duì)各個(gè)搜索結(jié)果進(jìn)行排序,得到排序后的搜索結(jié)果;
將排序后的搜索結(jié)果中前N個(gè)搜索結(jié)果作為第二搜索結(jié)果;其中,N為所述召回?cái)?shù)量閾值。
7.根據(jù)權(quán)利要求1或3所述的搜索方法,其特征在于,所述預(yù)設(shè)的多語(yǔ)種詞庫(kù)是基于歷史搜索關(guān)鍵詞構(gòu)建的離線數(shù)據(jù)庫(kù),所述多語(yǔ)種詞庫(kù)包括至少一個(gè)第一語(yǔ)種關(guān)鍵詞、第二語(yǔ)種關(guān)鍵詞、第二語(yǔ)種關(guān)鍵詞對(duì)應(yīng)的召回?cái)?shù)量,所述第一語(yǔ)種關(guān)鍵詞、第二語(yǔ)種關(guān)鍵詞以及召回?cái)?shù)量之間相互具有關(guān)聯(lián)關(guān)系。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京字節(jié)跳動(dòng)網(wǎng)絡(luò)技術(shù)有限公司,未經(jīng)北京字節(jié)跳動(dòng)網(wǎng)絡(luò)技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010555041.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





