[發(fā)明專利]基于決策樹算法的SEO關(guān)鍵詞競(jìng)爭(zhēng)程度計(jì)算方法無(wú)效
| 申請(qǐng)?zhí)枺?/td> | 201210411604.6 | 申請(qǐng)日: | 2012-10-24 |
| 公開(公告)號(hào): | CN102968447A | 公開(公告)日: | 2013-03-13 |
| 發(fā)明(設(shè)計(jì))人: | 朱欣娟;譚志強(qiáng) | 申請(qǐng)(專利權(quán))人: | 西安工程大學(xué) |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 西安弘理專利事務(wù)所 61214 | 代理人: | 張瑞琪 |
| 地址: | 710048 *** | 國(guó)省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 決策樹 算法 seo 關(guān)鍵詞 競(jìng)爭(zhēng) 程度 計(jì)算方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種SEO領(lǐng)域中的關(guān)鍵詞競(jìng)爭(zhēng)程度計(jì)算方法,特別是基于決策樹算法的SEO關(guān)鍵詞競(jìng)爭(zhēng)程度計(jì)算方法。
背景技術(shù)
關(guān)鍵詞是瀏覽者在搜索引擎中查找信息時(shí)輸入的詞語(yǔ),這些關(guān)鍵詞在SEO(Search?Engine?Optimization,搜索引擎優(yōu)化)中扮演著重要的角色,選擇合理的關(guān)鍵詞才能夠迎合用戶特定的搜索目標(biāo)。只有選擇正確的關(guān)鍵詞,才能使網(wǎng)站SEO走在正確的大方向上。確定什么樣的關(guān)鍵詞決定了網(wǎng)站內(nèi)容規(guī)劃、鏈接建設(shè)等重要后續(xù)步驟。但是現(xiàn)有的SEO關(guān)鍵詞計(jì)算方法基本都是定性描述的,如很多文獻(xiàn)給出了關(guān)鍵詞選擇的準(zhǔn)則,歸納有以下幾點(diǎn):①關(guān)鍵詞不能過(guò)于寬泛;②關(guān)鍵詞不要過(guò)于冷門;③要符合用戶的搜索習(xí)慣;④可以將地理位置、形容詞類的關(guān)鍵詞與提供產(chǎn)品或者服務(wù)的關(guān)鍵詞名稱合并,形成長(zhǎng)尾關(guān)鍵詞競(jìng)爭(zhēng)度會(huì)更強(qiáng)等。采用定性方法進(jìn)行SEO關(guān)鍵詞分析,很大程度上需要憑借SEO人員的經(jīng)驗(yàn)進(jìn)行,準(zhǔn)確度不高。因此,如何快速、準(zhǔn)確地對(duì)SEO關(guān)鍵詞競(jìng)爭(zhēng)度進(jìn)行量化分析,成為SEO人員迫切需要解決的重要問題。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于決策樹算法的SEO關(guān)鍵詞競(jìng)爭(zhēng)程度計(jì)算方法,克服了人工憑借經(jīng)驗(yàn)進(jìn)行SEO關(guān)鍵詞競(jìng)爭(zhēng)程度計(jì)算效率低、準(zhǔn)確性差的問題。
本發(fā)明所采用的技術(shù)方案是:基于決策樹算法的SEO關(guān)鍵詞競(jìng)爭(zhēng)程度計(jì)算方法,包括以下步驟:
(1)選取關(guān)鍵詞搜索結(jié)果數(shù)量P1、使用intitle指令搜索得到的結(jié)果頁(yè)面數(shù)P2、搜索結(jié)果是否存在付費(fèi)推廣P3、搜索結(jié)果第一頁(yè)中網(wǎng)站內(nèi)頁(yè)數(shù)P4、關(guān)鍵詞在搜索結(jié)果第一頁(yè)標(biāo)題中出現(xiàn)的次數(shù)P5、關(guān)鍵詞長(zhǎng)度P6作為關(guān)鍵詞競(jìng)爭(zhēng)程度C的影響因素;
(2)訓(xùn)練數(shù)據(jù)集的生成:按照“關(guān)鍵詞,P1,P2,P3,P4,P5,P6,C”為一條優(yōu)化數(shù)據(jù)記錄,整理歷史優(yōu)化數(shù)據(jù),并對(duì)相應(yīng)的屬性進(jìn)行概化,形成訓(xùn)練數(shù)據(jù)集;
(3)根據(jù)訓(xùn)練數(shù)據(jù)集構(gòu)建決策樹:以P1-P6為非類別屬性,以C為類別屬性,采用C4.5算法構(gòu)建出相應(yīng)的決策樹,該決策樹等價(jià)于一系列規(guī)則;
(4)應(yīng)用決策樹進(jìn)行關(guān)鍵詞競(jìng)爭(zhēng)程度分析:將待決策的SEO關(guān)鍵詞數(shù)據(jù)引入到上述決策樹中去,并計(jì)算出相應(yīng)的分析結(jié)果。
所述步驟(2)的屬性值概化方法如下:
將P1屬性概化為四個(gè)區(qū)間,即:{S1:[0,50萬(wàn)),S2:[50萬(wàn),100萬(wàn)),S3:[100萬(wàn),300萬(wàn)),S4:[300萬(wàn),10000萬(wàn))};
將P2屬性概化為三個(gè)區(qū)間,即:{T1:[0,10萬(wàn)),T2:[10萬(wàn),50萬(wàn)),T3:[50萬(wàn),100萬(wàn)),T4:[100萬(wàn),1000萬(wàn))};
將P4屬性概化為兩個(gè)區(qū)間,即:{U1:[0,5),U2:[5,10]};
將P5屬性概化為三個(gè)區(qū)間,即:{V1:[0,3),V2:[3,6),V3:[6,10]};
將P6屬性概化為四個(gè)區(qū)間,即:{W1:[0,6),W2:[6,10),W3:[10,20)};
按搜索結(jié)果是否存在付費(fèi)推廣P3可劃分為:Y(存在);N(不存在);
C分為四個(gè)級(jí)別:“競(jìng)爭(zhēng)很強(qiáng)”,“競(jìng)爭(zhēng)較強(qiáng)”,“競(jìng)爭(zhēng)較小”,“競(jìng)爭(zhēng)很小”。其中“競(jìng)爭(zhēng)很強(qiáng)”指的是由于該關(guān)鍵詞競(jìng)爭(zhēng)激烈,只能優(yōu)化該關(guān)鍵詞為35名之后;“競(jìng)爭(zhēng)較強(qiáng)”是指優(yōu)化關(guān)鍵詞排名在15至35,“競(jìng)爭(zhēng)較小”是指將關(guān)鍵詞優(yōu)化到4至12名,“競(jìng)爭(zhēng)很小”是該關(guān)鍵詞能夠優(yōu)化到搜索引擎檢索結(jié)果的前3名。
所述步驟(3)中C4.5算法是一種貪心算法,即選擇最優(yōu)的一個(gè)屬性作為下一階段的檢測(cè)屬性,具體過(guò)程如下:
1)以P1-P6為非類別屬性,以C為類別屬性,根據(jù)信息增益率公式,計(jì)算出當(dāng)前信息增益率最大的屬性;
2)將該屬性作為樹的根節(jié)點(diǎn);
3)根據(jù)該屬性值的個(gè)數(shù)將訓(xùn)練表中的數(shù)據(jù)分為相應(yīng)的分支;
4)對(duì)于每個(gè)分支,重復(fù)1)-3)的過(guò)程,直到所有的數(shù)據(jù)都用光為止;
5)將1)-4)過(guò)程中找到的屬性連起來(lái),就是一個(gè)決策樹,葉子節(jié)點(diǎn)上是“競(jìng)爭(zhēng)很強(qiáng)”,“競(jìng)爭(zhēng)較強(qiáng)”,“競(jìng)爭(zhēng)較小”,“競(jìng)爭(zhēng)很小”這四個(gè)類別值。
所述步驟(4)還包括以下步驟:
a).記錄需要預(yù)測(cè)的關(guān)鍵詞,獲取其對(duì)應(yīng)的影響因素P1-P6的值,P1-P6的獲取可以通過(guò)在搜索引擎中輸入關(guān)鍵詞,查看搜索結(jié)果的各項(xiàng)指標(biāo)的形式完成;
b).將記錄中與決策樹根對(duì)應(yīng)的屬性值檢索出來(lái),并與決策樹根屬性的值進(jìn)行比較,根據(jù)比較的結(jié)果決定下一層分支點(diǎn)的屬性;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安工程大學(xué),未經(jīng)西安工程大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210411604.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 用于去屑加工的切削刀片和刀具
- 一種搜索引擎優(yōu)化的SEO網(wǎng)站建設(shè)實(shí)現(xiàn)方法及系統(tǒng)
- 搜索引擎優(yōu)化信息的獲取方法和裝置
- 一種搜索引擎優(yōu)化SEO頁(yè)面生成方法和設(shè)備
- SEO站點(diǎn)構(gòu)建方法及SEO請(qǐng)求的響應(yīng)方法
- 一種在氫基質(zhì)MBfR中以NO<sub>3</sub>-還原SeO<sub>4</sub><sup>2-</sup>的方法
- 利用網(wǎng)絡(luò)爬蟲進(jìn)行SEO自動(dòng)優(yōu)化的方法及裝置
- 網(wǎng)站檢測(cè)方法和裝置
- 一種網(wǎng)站SEO信息推送方法
- 一種無(wú)機(jī)硒的熒光檢測(cè)方法





