[發明專利]一種聚類算法實現搜索引擎關鍵詞優化在審

申請號：	201611089249.X	申請日：	2016-11-30
公開（公告）號：	CN106649616A	公開（公告）日：	2017-05-10
發明（設計）人：	金平艷	申請（專利權）人：	四川用聯信息技術有限公司
主分類號：	G06F17/30	分類號：	G06F17/30
代理公司：	暫無信息	代理人：	暫無信息
地址：	610054 四川省成***	國省代碼：	四川;51
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種算法實現搜索引擎關鍵詞優化
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種聚類算法實現搜索引擎關鍵詞優化，本發明涉及語義網絡技術領域，具體涉及一種聚類算法實現搜索引擎關鍵詞優化，其特征是，包括如下步驟：

步驟1：根據企業業務確定核心關鍵詞，利用搜索引擎搜集相關關鍵字，這些關鍵字在搜索引擎中有相應數據項，如本國每月搜索量、競爭程度和估算每次點擊費用等

步驟2：結合企業產品和市場分析，篩選降維上述搜索到的相關關鍵字集合；

步驟3：針對篩選降維后的關鍵詞集合，通過搜索引擎搜索關鍵詞對應的頁面，這里記錄首頁網頁數和總搜索頁面數，即每個關鍵詞由五維向量再降維為四維的，其具體計算過程如下：

這里相關關鍵詞個數為m，既有下列矩陣：

、、、、依次為第i個關鍵詞對應的本國每月搜索量、競爭程度、估算每次點擊費用、首頁網頁數、總搜索頁面數

再降維為四維，即

為搜索效能，為價值率，即為下式：

步驟4：一種聚類算法，對上述關鍵詞進行聚類處理，其具體子步驟如下：

步驟4.1：利用基于領域的k-means算法初始化簇；

步驟4.2：初始化每一個領域的相似度函數，從數據對象集合D中按下述判定條件選擇k個初始簇中心；

步驟4.3：對每類關鍵詞進行重新分配，按相似度函數選擇聚類中心；

步驟4.4：根據判定函數的結果，重新計算各簇中心；

步驟4.5：如果簇中心發生變化，則轉到步驟4.2，否則迭代結束，輸出聚類結果

步驟5：根據企業具體情況，綜合關鍵詞效能優化和價值率優化，選擇合適的關鍵詞優化策略達到網站優化目標。

2.根據權利要求1中所述的一種聚類算法實現搜索引擎關鍵詞優化，其特征是，以上所述步驟4中的具體計算過程如下：

步驟4：利用一種聚類算法，對上述關鍵詞進行聚類處理，其具體子步驟如下：

步驟4.1：利用基于領域的k-means算法初始化簇

步驟4.2：初始化每一個領域的相似度函數，從數據對象集合D中按下述判定條件選擇k個初始簇中心，其具體計算過程如下：

上式為每一個領域內數據對象的個數，為每一個領域內第i個關鍵詞向量與其中心點向量的相似度，、分別為數量、相似度函數的影響系數，且，，其值可以根據實驗迭代出合適的值

為屬于j類的第i個關鍵詞的空間向量，為j類簇中心向量，h為向量對應元素的個數

判定條件如下：

為設定好的閾值，只有滿足上式條件則歸為一簇，則篩選k類出來

步驟4.3：對每類關鍵詞進行重新分配，按相似度函數選擇聚類中心，其具體計算過程如下：

按值最大選擇對應的聚類中心

步驟4.4：根據判定函數的結果，重新計算各簇中心，其具體計算過程如下：

為第N次迭代得到的全局相似度函數，為第N次迭代第j類簇的相似度函數

滿足上式，則重新計算各簇中心

步驟4.5：如果簇中心發生變化，則轉到步驟4.2，否則迭代結束，輸出聚類結果。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于四川用聯信息技術有限公司，未經四川用聯信息技術有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201611089249.X/1.html，轉載請聲明來源鉆瓜專利網。

專利分類

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】