[發(fā)明專利]搜索關(guān)鍵詞的類名選取方法和裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201510850384.0 | 申請(qǐng)日: | 2015-11-27 |
| 公開(公告)號(hào): | CN106815228B | 公開(公告)日: | 2020-03-03 |
| 發(fā)明(設(shè)計(jì))人: | 賀達(dá);馮鴛鶴 | 申請(qǐng)(專利權(quán))人: | 北京國(guó)雙科技有限公司 |
| 主分類號(hào): | G06F16/953 | 分類號(hào): | G06F16/953;G06F16/955;G06F16/35 |
| 代理公司: | 北京康信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11240 | 代理人: | 趙囡囡;吳貴明 |
| 地址: | 100083 北京市海淀區(qū)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 搜索關(guān)鍵詞 選取 方法 裝置 | ||
本申請(qǐng)公開了一種搜索關(guān)鍵詞的類名選取方法和裝置。其中,該方法包括:對(duì)目標(biāo)網(wǎng)站的搜索關(guān)鍵詞進(jìn)行聚類,得到多類搜索關(guān)鍵詞,其中,搜索關(guān)鍵詞為對(duì)目標(biāo)網(wǎng)站進(jìn)行站內(nèi)搜索時(shí)所采用的關(guān)鍵詞,目標(biāo)網(wǎng)站通過欄目劃分站內(nèi)頁(yè)面;查詢搜索關(guān)鍵詞在目標(biāo)網(wǎng)站進(jìn)行站內(nèi)搜索時(shí)所著陸的著陸頁(yè)面,確定搜索關(guān)鍵詞對(duì)應(yīng)的著陸頁(yè)面所在欄目的欄目名稱;對(duì)于多類搜索關(guān)鍵詞中每一類搜索關(guān)鍵詞,從每一類搜索關(guān)鍵詞所包含的搜索關(guān)鍵詞對(duì)應(yīng)的著陸頁(yè)面所在欄目的欄目名稱中選擇一個(gè)欄目名稱,作為該類搜索關(guān)鍵詞的類名。本申請(qǐng)解決了現(xiàn)有的選取方式選出的類名不能反映所在類的特點(diǎn)的技術(shù)問題。
技術(shù)領(lǐng)域
本申請(qǐng)涉及互聯(lián)網(wǎng)領(lǐng)域,具體而言,涉及一種搜索關(guān)鍵詞的類名選取方法和裝置。
背景技術(shù)
在互聯(lián)網(wǎng)領(lǐng)域,網(wǎng)站是用于向用戶提供信息的重要平臺(tái)。大部分網(wǎng)站都提供了站內(nèi)搜索,以供用戶在網(wǎng)站內(nèi)搜索相關(guān)信息。通過記錄用戶所搜索的內(nèi)容即可了解用戶比較關(guān)注的信息,及其需求。為了更好地了解用戶的關(guān)注點(diǎn)和需求,網(wǎng)站運(yùn)營(yíng)商通常會(huì)對(duì)用戶在網(wǎng)站的站內(nèi)搜索關(guān)鍵詞進(jìn)行歸類,將一系列相關(guān)的搜索關(guān)鍵詞分到一個(gè)類下,并給每個(gè)類定義其類名。
然而,現(xiàn)有的搜索關(guān)鍵詞的類名的選取方式,通常是選取在一類搜索關(guān)鍵詞中一定范圍內(nèi)與該類其他詞聯(lián)系最多的詞作為類名,而用這樣選擇出來(lái)的類名通常是與大部分詞都有關(guān)聯(lián)但是卻不能反映所在類的特點(diǎn)的詞,例如在搜索關(guān)鍵詞的類【房地產(chǎn),房屋,地產(chǎn),商品房,物業(yè),購(gòu)置稅】中通過以上現(xiàn)有的方式選擇的類名會(huì)是“購(gòu)置稅”,因?yàn)椤百?gòu)置稅”與其他詞都有關(guān)聯(lián),而其他詞之間因?yàn)槭墙x詞可以相互替代反而聯(lián)系較少。然而通過對(duì)這些搜索關(guān)鍵詞進(jìn)行分析,可以很明顯的看出使用房地產(chǎn)作為類名的效果會(huì)更好。
針對(duì)上述的問題,目前尚未提出有效的解決方案。
發(fā)明內(nèi)容
本申請(qǐng)實(shí)施例提供了一種搜索關(guān)鍵詞的類名選取方法和裝置,以至少解決現(xiàn)有的選取方式選出的類名不能反映所在類的特點(diǎn)的技術(shù)問題。
根據(jù)本申請(qǐng)實(shí)施例的一個(gè)方面,提供了一種搜索關(guān)鍵詞的類名選取方法,包括:對(duì)目標(biāo)網(wǎng)站的搜索關(guān)鍵詞進(jìn)行聚類,得到多類搜索關(guān)鍵詞,其中,所述搜索關(guān)鍵詞為對(duì)所述目標(biāo)網(wǎng)站進(jìn)行站內(nèi)搜索時(shí)所采用的關(guān)鍵詞,所述目標(biāo)網(wǎng)站通過欄目劃分站內(nèi)頁(yè)面;查詢所述搜索關(guān)鍵詞在所述目標(biāo)網(wǎng)站進(jìn)行站內(nèi)搜索時(shí)所著陸的著陸頁(yè)面,確定所述搜索關(guān)鍵詞對(duì)應(yīng)的著陸頁(yè)面所在欄目的欄目名稱;對(duì)于所述多類搜索關(guān)鍵詞中每一類搜索關(guān)鍵詞,從所述每一類搜索關(guān)鍵詞所包含的搜索關(guān)鍵詞對(duì)應(yīng)的著陸頁(yè)面所在欄目的欄目名稱中選擇一個(gè)欄目名稱,作為該類搜索關(guān)鍵詞的類名。
進(jìn)一步地,從所述每一類搜索關(guān)鍵詞所包含的搜索關(guān)鍵詞對(duì)應(yīng)的著陸頁(yè)面所在欄目的欄目名稱中選擇一個(gè)欄目名稱,作為該類搜索關(guān)鍵詞的類名包括:統(tǒng)計(jì)所述每一類搜索關(guān)鍵詞中搜索關(guān)鍵詞對(duì)應(yīng)的著陸頁(yè)面所在欄目的欄目名稱的出現(xiàn)次數(shù);以及對(duì)于所述每一類搜索關(guān)鍵詞,選擇統(tǒng)計(jì)后出現(xiàn)次數(shù)最多的欄目名稱作為該類搜索關(guān)鍵詞的類名。
進(jìn)一步地,在對(duì)目標(biāo)網(wǎng)站的搜索關(guān)鍵詞進(jìn)行聚類,得到多類搜索關(guān)鍵詞之前,所述方法還包括:獲取所述目標(biāo)網(wǎng)站的歷史訪問數(shù)據(jù);對(duì)所述歷史訪問數(shù)據(jù)進(jìn)行解析,得到所述目標(biāo)網(wǎng)站的搜索關(guān)鍵詞及其對(duì)應(yīng)的著陸頁(yè)面。
進(jìn)一步地,在對(duì)所述歷史訪問數(shù)據(jù)進(jìn)行解析,得到所述目標(biāo)網(wǎng)站的搜索關(guān)鍵詞及其對(duì)應(yīng)的著陸頁(yè)面之后,所述方法還包括:建立所述搜索關(guān)鍵詞與所述著陸頁(yè)面的對(duì)應(yīng)關(guān)系;其中,查詢所述搜索關(guān)鍵詞在所述目標(biāo)網(wǎng)站進(jìn)行站內(nèi)搜索時(shí)所著陸的著陸頁(yè)面包括:以所述搜索關(guān)鍵詞為索引,利用所述對(duì)應(yīng)關(guān)系查詢所述搜索關(guān)鍵詞對(duì)應(yīng)的著陸頁(yè)面。
進(jìn)一步地,對(duì)目標(biāo)網(wǎng)站的搜索關(guān)鍵詞進(jìn)行聚類,得到多類搜索關(guān)鍵詞包括:用K-means聚類算法對(duì)所述目標(biāo)網(wǎng)站的搜索關(guān)鍵詞進(jìn)行聚類,得到所述多類搜索關(guān)鍵詞。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京國(guó)雙科技有限公司,未經(jīng)北京國(guó)雙科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510850384.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





