[發(fā)明專利]欄目分類方法和裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201611042667.3 | 申請(qǐng)日: | 2016-11-23 |
| 公開(公告)號(hào): | CN108090090A | 公開(公告)日: | 2018-05-29 |
| 發(fā)明(設(shè)計(jì))人: | 潘峰 | 申請(qǐng)(專利權(quán))人: | 北京國雙科技有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 北京康信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11240 | 代理人: | 韓建偉;張永明 |
| 地址: | 100086 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 關(guān)鍵詞集合 方法和裝置 欄目分類 獲取目標(biāo) 名稱匹配 人工分類 網(wǎng)站 申請(qǐng) 匹配 成功 | ||
本申請(qǐng)公開了一種欄目分類方法和裝置。其中,該方法包括:獲取各個(gè)欄目類型對(duì)應(yīng)的關(guān)鍵詞集合,得到多個(gè)關(guān)鍵詞集合;獲取目標(biāo)欄目的名稱;將目標(biāo)欄目的名稱與多個(gè)關(guān)鍵詞集合中的關(guān)鍵詞進(jìn)行匹配,得到與目標(biāo)欄目的名稱匹配成功的第一關(guān)鍵詞;根據(jù)第一關(guān)鍵詞所在的關(guān)鍵詞集合確定對(duì)應(yīng)的第一欄目類型;將目標(biāo)欄目劃分到第一欄目類型中。本申請(qǐng)解決了現(xiàn)有技術(shù)中對(duì)網(wǎng)站的欄目進(jìn)行人工分類導(dǎo)致效率低的技術(shù)問題。
技術(shù)領(lǐng)域
本申請(qǐng)涉及互聯(lián)網(wǎng)領(lǐng)域,具體而言,涉及一種欄目分類方法和裝置。
背景技術(shù)
在網(wǎng)站普查中,需要對(duì)網(wǎng)站各個(gè)欄目進(jìn)行評(píng)分,對(duì)每個(gè)欄目的評(píng)分標(biāo)準(zhǔn)將依據(jù)該欄目所屬的類型來確定,這里就涉及到需要對(duì)網(wǎng)站的每個(gè)欄目進(jìn)行分類。由于網(wǎng)站數(shù)量龐大,各個(gè)網(wǎng)站之間設(shè)計(jì)和實(shí)現(xiàn)均有一定差異,導(dǎo)致了網(wǎng)站欄目命名有一定的差異,進(jìn)而導(dǎo)致了無法簡(jiǎn)單地直接使用欄目名稱對(duì)網(wǎng)站的每個(gè)欄目進(jìn)行分類。
目前欄目分類使用的是人工分類的方式,在梳理網(wǎng)站欄目時(shí)會(huì)依據(jù)每個(gè)欄目名稱及內(nèi)容來確定該欄目所屬類型。
對(duì)網(wǎng)站的欄目進(jìn)行人工分類的方式存在以下問題:(1)人工分類需要耗費(fèi)大量人力和時(shí)間,效率比較低;(2)不同人的主觀判斷存在一定的差異,不同人對(duì)網(wǎng)站的欄目進(jìn)行人工分類得到的分類結(jié)果不同,主觀性太強(qiáng)。
針對(duì)上述的問題,目前尚未提出有效的解決方案。
發(fā)明內(nèi)容
本申請(qǐng)實(shí)施例提供了一種欄目分類方法和裝置,以至少解決現(xiàn)有技術(shù)中對(duì)網(wǎng)站的欄目進(jìn)行人工分類導(dǎo)致效率低的技術(shù)問題。
根據(jù)本申請(qǐng)實(shí)施例的一個(gè)方面,提供了一種欄目分類方法,包括:獲取各個(gè)欄目類型對(duì)應(yīng)的關(guān)鍵詞集合,得到多個(gè)關(guān)鍵詞集合;獲取目標(biāo)欄目的名稱;將所述目標(biāo)欄目的名稱與所述多個(gè)關(guān)鍵詞集合中的關(guān)鍵詞進(jìn)行匹配,得到與所述目標(biāo)欄目的名稱匹配成功的第一關(guān)鍵詞;根據(jù)所述第一關(guān)鍵詞所在的關(guān)鍵詞集合確定對(duì)應(yīng)的第一欄目類型;將所述目標(biāo)欄目劃分到所述第一欄目類型中。
進(jìn)一步地,將所述目標(biāo)欄目的名稱與所述多個(gè)關(guān)鍵詞集合中的關(guān)鍵詞進(jìn)行匹配,得到與所述目標(biāo)欄目的名稱匹配成功的第一關(guān)鍵詞包括:將所述目標(biāo)欄目的名稱依次與所述多個(gè)關(guān)鍵詞集合中的每個(gè)關(guān)鍵詞進(jìn)行匹配,得到多個(gè)匹配度;將所述多個(gè)匹配度按照大小進(jìn)行排序;篩選出最大的匹配度;將所述最大的匹配度對(duì)應(yīng)的關(guān)鍵詞作為所述第一關(guān)鍵詞。
進(jìn)一步地,將所述目標(biāo)欄目的名稱依次與所述多個(gè)關(guān)鍵詞集合中的每個(gè)關(guān)鍵詞進(jìn)行匹配,得到多個(gè)匹配度包括:將所述目標(biāo)欄目的名稱進(jìn)行分詞,得到多個(gè)第一分詞詞語;將所述多個(gè)第一分詞詞語中的每個(gè)第一分詞詞語依次與所述多個(gè)關(guān)鍵詞集合中的每個(gè)關(guān)鍵詞進(jìn)行匹配,得到多個(gè)匹配度。
進(jìn)一步地,所述多個(gè)關(guān)鍵詞集合為N個(gè)關(guān)鍵詞集合,獲取各個(gè)欄目類型對(duì)應(yīng)的關(guān)鍵詞集合,得到多個(gè)關(guān)鍵詞集合包括:獲取劃分到第i欄目類型的多個(gè)欄目的名稱,其中,i依次取1至N,N為欄目類型的數(shù)量;將劃分到所述第i欄目類型的多個(gè)欄目的名稱進(jìn)行分詞,得到所述第i欄目類型對(duì)應(yīng)的關(guān)鍵詞集合。
進(jìn)一步地,將劃分到所述第i欄目類型的多個(gè)欄目的名稱進(jìn)行分詞,得到所述第i欄目類型對(duì)應(yīng)的關(guān)鍵詞集合包括:將劃分到所述第i欄目類型的多個(gè)欄目的名稱進(jìn)行分詞,得到多個(gè)第二關(guān)鍵詞;從所述多個(gè)第二關(guān)鍵詞中篩選出第三關(guān)鍵詞,其中,所述第三關(guān)鍵詞是所述第二關(guān)鍵詞中出現(xiàn)次數(shù)大于等于預(yù)設(shè)次數(shù)的第二關(guān)鍵詞;將所述第三關(guān)鍵詞構(gòu)成的集合作為所述第i欄目類型對(duì)應(yīng)的關(guān)鍵詞集合。
根據(jù)本申請(qǐng)實(shí)施例的另一方面,還提供了一種欄目分類裝置,包括:第一獲取單元,用于獲取各個(gè)欄目類型對(duì)應(yīng)的關(guān)鍵詞集合,得到多個(gè)關(guān)鍵詞集合;第二獲取單元,用于獲取目標(biāo)欄目的名稱;匹配單元,用于將所述目標(biāo)欄目的名稱與所述多個(gè)關(guān)鍵詞集合中的關(guān)鍵詞進(jìn)行匹配,得到與所述目標(biāo)欄目的名稱匹配成功的第一關(guān)鍵詞;確定單元,根據(jù)所述第一關(guān)鍵詞所在的關(guān)鍵詞集合確定對(duì)應(yīng)的第一欄目類型;劃分單元,用于將所述目標(biāo)欄目劃分到所述第一欄目類型中。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京國雙科技有限公司,未經(jīng)北京國雙科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611042667.3/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 用于選擇用于網(wǎng)絡(luò)發(fā)布的關(guān)鍵詞的方法和設(shè)備
- 自動(dòng)建立關(guān)鍵詞索引表的方法
- 關(guān)鍵詞推薦方法及裝置
- 用于推送關(guān)鍵詞的方法、裝置以及設(shè)備
- 關(guān)鍵詞推薦方法、裝置、計(jì)算設(shè)備及存儲(chǔ)介質(zhì)
- 基于重點(diǎn)關(guān)鍵詞的關(guān)鍵詞拓展方法和裝置
- 關(guān)鍵詞規(guī)則生成方法及裝置和電子設(shè)備
- 關(guān)鍵詞廣告投放自動(dòng)化否定關(guān)鍵詞方法及裝置
- 用于處理信息的方法和裝置
- 一種關(guān)鍵詞推薦的方法、相關(guān)裝置以及存儲(chǔ)介質(zhì)





