[發明專利]一種模糊K均值聚類算法實現搜索引擎優化技術在審
| 申請號: | 201710046723.9 | 申請日: | 2017-01-22 |
| 公開(公告)號: | CN106933953A | 公開(公告)日: | 2017-07-07 |
| 發明(設計)人: | 金平艷 | 申請(專利權)人: | 四川用聯信息技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 610054 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 模糊 均值 算法 實現 搜索引擎 優化 技術 | ||
1.一種模糊K均值聚類算法實現搜索引擎優化技術,本發明涉及語義網絡技術領域,具體涉及一種模糊K均值聚類算法實現搜索引擎優化技術,其特征是,包括如下步驟:
步驟1:根據企業業務確定核心關鍵詞,利用搜索引擎搜集相關關鍵字,這些關鍵字在搜索引擎中有相應數據項,如本國每月搜索量、競爭程度和估算每次點擊費用等
步驟2:結合企業產品和市場分析,篩選降維上述搜索到的相關關鍵字集合;
步驟3:針對篩選降維后的關鍵詞集合,通過搜索引擎搜索關鍵詞對應的頁面,這里記錄首頁網頁數和總搜索頁面數,即每個關鍵詞由五維向量再降維為四維的,其具體計算過程如下:
這里相關關鍵詞個數為m,既有下列矩陣:
、、、、依次為第i個關鍵詞對應的本國每月搜索量、競爭程度、估算每次點擊費用(CPC)、首頁網頁數、總搜索頁面數再降維
為四維,即
為搜索效能,為價值率,即為下式:
步驟4:一種模糊K均值聚類算法,對上述關鍵詞進行聚類處理,其具體子步驟如下:
步驟4.1:利用基于領域的k-means算法初始化簇,篩選出k簇;
步驟4.2:用值[0,1]間的隨機數初始化隸屬矩陣J,使其滿足隸屬的整個約束條件 ;
步驟4.3:構建k類總目標函數J,綜合隸屬約束條件,構建m個方程組,對其進行求解,即可求出使總目標函數J最大的必要條件、;
步驟4.4:根據判定函數、、的大小來確定迭代的結束;
步驟5:根據企業具體情況,綜合關鍵詞效能優化和價值率優化,選擇合適的關鍵詞優化策略達到網站優化目標。
2.根據權利要求1中所述的一種模糊K均值聚類算法實現搜索引擎優化技術
其特征是,以上所述步驟4中的具體計算過程如下:
步驟4:一種模糊K均值聚類算法,對上述關鍵詞進行聚類處理,其具體子步驟如下:
步驟4.1:利用基于領域的k-means算法初始化簇,篩選出k簇;
步驟4.2:用值[0,1]間的隨機數初始化隸屬矩陣J,使其滿足隸屬的整個約束條件 ;
構建隨機隸屬矩陣J為:
為關鍵詞i屬于j類的程度系數,即
隸屬的整個約束條件為:
步驟4.3:構建k類總目標函數J,綜合隸屬約束條件,構建m個方程組,對其進行求解,即可求出使總目標函數J最大的必要條件、,其具體計算過程如下:
根據總目標函數J,構建帶有m個約束式的拉格朗日算子方程組,即有下式:
上式為j類數據對象個數,為j類關鍵詞x所對應的向量,為j類關鍵詞y所對應向量,為j類中兩關鍵詞的屬性差值;
上式h為數據對象屬性個數,h=4,為j類關鍵詞的均值,同理,為j類關鍵詞的均值
是m個約束式的拉格朗日算子,對上述式子進行求導,對所有輸入參量求導,即可求得使J達到最大的必要條件、:
這里的為類j簇中心,跟上面的不一樣,為數據對象對應向量
步驟4.4:根據判定函數、、的大小來確定迭代的結束,其具體計算過程如下:
上式為當前迭代的總目標函數值,為上一次總目標函數值,為前后迭代的隸屬變化值,為前后迭代的類中心變化值,、、為足夠小的閾值,只有滿足上述三個條件,則迭代結束,輸出最佳聚類結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川用聯信息技術有限公司,未經四川用聯信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710046723.9/1.html,轉載請聲明來源鉆瓜專利網。





