[發明專利]基于決策樹分類算法實現搜索引擎優化技術在審
| 申請號: | 201710046903.7 | 申請日: | 2017-01-22 |
| 公開(公告)號: | CN106933954A | 公開(公告)日: | 2017-07-07 |
| 發明(設計)人: | 金平艷 | 申請(專利權)人: | 四川用聯信息技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q30/02;G06F17/27;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 610054 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 決策樹 分類 算法 實現 搜索引擎 優化 技術 | ||
技術領域
本發明涉及語義網絡技術領域,具體涉及基于決策樹分類算法實現搜索引擎優化技術。
背景技術
隨著互聯網技術不斷發展,網絡信息量迅速增長,搜索引擎逐漸成為用戶快速準確查找信息的主要工具。搜索引擎優化,簡稱通俗的講是通過對網站整體架構,網頁內容、關鍵詞以及網頁內的鏈接進行相關的優化工作,提高其在特定搜索引擎上搜索結果中的排名,從而提高網站訪問量,最終提升網站的銷售能力或宣傳能力的技術,搜索引擎優化不單單要考慮搜索引擎的算法和排名規則,還要考慮用戶的搜索偏好,選取用戶常用的關鍵詞、站在用戶角度來體驗網頁瀏覽的舒適度都是很好的搜索引擎優化原則。目前關于搜索引擎優化方法的理論研究已較為豐富,如黑帽技術和白帽技術,搜索引擎優化策略,分別是域名策略、網頁設計規劃策略、關鍵詞策略以及鏈接策略。SEO歸根結底是關鍵詞的優化策略,現今國內外對關鍵詞優化的理論研究和技術應用比較多,但暫未提出一個有效的方法來簡化關鍵詞分析流程,也沒有一個完善的機制來管理關鍵詞優化策略和進度。基于上述需求,本發明提供了一種基于決策樹分類算法實現搜索引擎優化技術。
發明內容
針對于關鍵詞優化實現搜索引擎優化的技術問題,本發明提供了基于決策樹分類算法實現搜索引擎優化技術。
為了解決上述問題,本發明是通過以下技術方案實現的:
步驟1:根據企業業務確定核心關鍵詞,利用搜索引擎搜集相關關鍵字,這些關鍵字在搜索引擎中有相應數據項,如本國每月搜索量、競爭程度和估算每次點擊費用(CPC)等
步驟2:結合企業產品和市場分析,篩選降維上述搜索到的相關關鍵字集合;
步驟3:針對篩選降維后的關鍵詞集合,通過搜索引擎搜索關鍵詞對應的頁面,這里記錄首頁網頁數和總搜索頁面數,即每個關鍵詞由五維向量再降維為四維的。
步驟4:基于決策樹分類算法,對上述關鍵詞進行分類處理,其具體子步驟如下:
步驟4.1:根據訓練數據集構造決策樹分類器模型,其具體子步驟如下:
步驟4.1.1:設訓練集中有X個樣本,屬性個數為4,即n=(S1,S2,S3,S4),同時分裂屬性Si對應了k個類,其中Lr∈(L1,L2…,Lk),i∈(1,2,3,4),r∈(1,2…,k)。相關領域用戶設定好誤分類代價矩陣C。
步驟4.1.2:創建根節點G。
步驟4.1.3:如果訓練數據集為空,則返回結點G并標記失敗。
步驟4.1.4:如果訓練數據集中所有記錄都屬于同一類別,則該類型標記結點G。
步驟4.1.5:如果候選屬性為空,則返回G為葉子結點,標記為訓練數據集中最普通的類。
步驟4.1.6:根據屬性S的目標函數f從候選屬性中選擇splitS。
步驟4.1.7:標記節點G為屬性splitSi。
步驟4.1.8:由節點延伸出滿足條件為splitS=splitSi分支以及splitSi=splitSij子分支,如果滿足以下兩條件之一,就停止建樹。
4.1.8.1這里假設Yii為訓練數據集中splitS=splitSi的樣本集合,如果Yii為空,加上一個葉子結點,標記為訓練數據集中最普通的類。
4.1.8.2此節點中所有例子屬于同一類。
步驟4.1.9:非4.1.8.1與4.1.8.2中情況,則遞歸調用步驟1.1.6至步驟4.1.8。
步驟4.1.10:保存已生成的決策樹分類器。
步驟4.2:應用上述的分類器模型,對步驟3中得到的關鍵詞進行分類,即可得到最佳k類;
步驟5:根據企業具體情況,綜合關鍵詞效能優化和價值率優化,選擇合適的關鍵詞優化策略達到網站優化目標。
本發明有益效果是:
1,此算法可以精簡關鍵詞分析流程,進而減少整個網站優化工作量。
2,此算法的運行時間復雜度低,處理速度更快。
3、此算法具有更大的利用價值。
4、能幫助網站在短時間內快速提升其關鍵詞的排名。
5、為企業網站帶來一定的流量和詢盤,從而達到理想的網站優化目標。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川用聯信息技術有限公司,未經四川用聯信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710046903.7/2.html,轉載請聲明來源鉆瓜專利網。





