[發明專利]一種聚類算法實現搜索引擎關鍵詞優化在審
| 申請號: | 201611089249.X | 申請日: | 2016-11-30 |
| 公開(公告)號: | CN106649616A | 公開(公告)日: | 2017-05-10 |
| 發明(設計)人: | 金平艷 | 申請(專利權)人: | 四川用聯信息技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 610054 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 算法 實現 搜索引擎 關鍵詞 優化 | ||
1.一種聚類算法實現搜索引擎關鍵詞優化,本發明涉及語義網絡技術領域,具體涉及一種聚類算法實現搜索引擎關鍵詞優化,其特征是,包括如下步驟:
步驟1:根據企業業務確定核心關鍵詞,利用搜索引擎搜集相關關鍵字,這些關鍵字在搜索引擎中有相應數據項,如本國每月搜索量、競爭程度和估算每次點擊費用等
步驟2:結合企業產品和市場分析,篩選降維上述搜索到的相關關鍵字集合;
步驟3:針對篩選降維后的關鍵詞集合,通過搜索引擎搜索關鍵詞對應的頁面,這里記錄首頁網頁數和總搜索頁面數,即每個關鍵詞由五維向量再降維為四維的,其具體計算過程如下:
這里相關關鍵詞個數為m,既有下列矩陣:
、、、、依次為第i個關鍵詞對應的本國每月搜索量、競爭程度、估算每次點擊費用、首頁網頁數、總搜索頁面數
再降維為四維,即
為搜索效能,為價值率,即為下式:
步驟4:一種聚類算法,對上述關鍵詞進行聚類處理,其具體子步驟如下:
步驟4.1:利用基于領域的k-means算法初始化簇;
步驟4.2:初始化每一個領域的相似度函數,從數據對象集合D中按下述判定條件選擇k個初始簇中心;
步驟4.3:對每類關鍵詞進行重新分配,按相似度函數選擇聚類中心;
步驟4.4:根據判定函數的結果,重新計算各簇中心;
步驟4.5:如果簇中心發生變化,則轉到步驟4.2,否則迭代結束,輸出聚類結果
步驟5:根據企業具體情況,綜合關鍵詞效能優化和價值率優化,選擇合適的關鍵詞優化策略達到網站優化目標。
2.根據權利要求1中所述的一種聚類算法實現搜索引擎關鍵詞優化,其特征是,以上所述步驟4中的具體計算過程如下:
步驟4:利用一種聚類算法,對上述關鍵詞進行聚類處理,其具體子步驟如下:
步驟4.1:利用基于領域的k-means算法初始化簇
步驟4.2:初始化每一個領域的相似度函數,從數據對象集合D中按下述判定條件選擇k個初始簇中心,其具體計算過程如下:
上式為每一個領域內數據對象的個數,為每一個領域內第i個關鍵詞向量與其中心點向量的相似度,、分別為數量、相似度函數的影響系數,且,,其值可以根據實驗迭代出合適的值
為屬于j類的第i個關鍵詞的空間向量,為j類簇中心向量,h為向量對應元素的個數
判定條件如下:
為設定好的閾值,只有滿足上式條件則歸為一簇,則篩選k類出來
步驟4.3:對每類關鍵詞進行重新分配,按相似度函數選擇聚類中心,其具體計算過程如下:
按值最大選擇對應的聚類中心
步驟4.4:根據判定函數的結果,重新計算各簇中心,其具體計算過程如下:
為第N次迭代得到的全局相似度函數,為第N次迭代第j類簇的相似度函數
滿足上式,則重新計算各簇中心
步驟4.5:如果簇中心發生變化,則轉到步驟4.2,否則迭代結束,輸出聚類結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川用聯信息技術有限公司,未經四川用聯信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611089249.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種日志段管理方法及裝置
- 下一篇:床頭柜





