[發明專利]基于注意力流網絡模型的互聯網站點影響力的定量評估方法有效
| 申請號: | 202011266716.8 | 申請日: | 2020-11-13 |
| 公開(公告)號: | CN112380465B | 公開(公告)日: | 2022-11-11 |
| 發明(設計)人: | 李勇;薛向軍;張小康;火胤 | 申請(專利權)人: | 蘭州七度數聚技術有限公司 |
| 主分類號: | G06F16/955 | 分類號: | G06F16/955;G06F16/958;H04L43/106 |
| 代理公司: | 蘭州中科華西專利代理有限公司 62002 | 代理人: | 馬小瑞 |
| 地址: | 730070 甘肅省蘭州市安寧區萬新*** | 國省代碼: | 甘肅;62 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 注意力 流網 模型 互聯網 站點 影響力 定量 評估 方法 | ||
本發明公開了一種基于注意力流網絡模型的互聯網站點影響力的定量評估方法,包括對海量群體用戶的在線點擊流數據進行數據清洗,得到群體用戶的注意力轉換序列;構建群體注意力流網絡;計算注意力流矩陣M、概率轉移矩陣P、注意力耗散矩陣Q和基本矩陣U;計算互聯網站點影響力Ci。本發明提出的群體注意力流網絡模型和傳統站點排名的超鏈接PageRank算法等模型相比較,超鏈接模型需要將流網絡數據迭代計算超過近百次才能得到最終結果,本發明提出的群體注意力流網絡模型站點影響力計算方法僅需要計算一次,與傳統計算方法相比本發明具有較大優勢,性能遠優于超鏈接模型。
技術領域
本發明涉及互聯網技術領域,具體的說是一種基于注意力流網絡模型的互聯網站點影響力的定量評估方法。
背景技術
近年來,隨著HTML5標準的建立與移動端軟件的需求不斷增長,越來越多的軟件基于B/S架構開發。B/S架構的軟件爆炸式發展累積了大量的在線點擊流數據,通過互聯網站點評估方法不僅能夠揭示Web站點的演化過程,為Web站點的良性發展提供可靠的理論指導,而且能夠為互聯網在線廣告等商業領域提供智能化的解決方案,實現利益最大化。然而,傳統互聯網站點的評估大多是通過超鏈接方法分析其結構以及站點的影響力。超鏈接分析方法有其局限性,許多互聯網站點沒有對外的超鏈接,使得超鏈接分析方法難以展示互聯網站點與用戶之間豐富的交互模式。
發明內容
為了克服超連接分析的局限性,本發明的目的是提供一種互聯網站點影響力評估方法,利用群體用戶注意力流機制,結合用戶在網絡中注意力的轉移特征,表征用戶行為與互聯網站點協同演化的機制,基于注意力流網絡模型定義變量,從而定量計算互聯網站點的影響力。
為實現上述目的,本發明所提供的技術方案為:
基于注意力流網絡模型的互聯網站點影響力的定量評估方法,包括對海量群體用戶的在線點擊流數據進行數據清洗,得到群體用戶的注意力轉移序列;構建群體注意力流網絡;計算注意力流矩陣M、概率轉移矩陣P、注意力耗散矩陣Q和基本矩陣U;計算互聯網站點影響力Ci;通過以下步驟實現:
1)數據預處理:
逐一提取海量群體用戶在線點擊流數據中每個用戶的瀏覽器進程記錄,保存每個用戶點擊流數據記錄中存在的統一資源定位器URL和時間戳;從所保存的統一資源定位器URL中抽取出域名信息,將時間戳轉換為對應的點擊時間,得到清洗后的數據,清洗后的數據包括統一資源定位器URL對應的域名信息和點擊時間;
2)加權有向注意力流網絡的構建:
2.1)逐一讀取數據預處理過程中得到的每個用戶點擊流數據序列,建立一個虛擬節點Source表示注意力流的“源”,從虛擬節點Source向第1條點擊記錄的域名引出1條有向邊;
2.2)判斷下一條點擊記錄與上一條點擊記錄的時間差,如果超過30分鐘,則以上一條點擊記錄的域名為節點,引出1條有向邊到一個虛擬節點Sink,虛擬節點Sink表示注意力流的“匯”;從虛擬節點Source向下一條點擊記錄中的域名為節點引出1條有向邊,同時更新上一條記錄的域名停留時間,如果沒有超過30分鐘,則執行步驟2.3);
2.3)判斷下一條點擊記錄與上一條點擊記錄的域名是否相同,如果相同,則更新該域名的停留時間,如果不同,則以上一條點擊記錄的域名為節點向下一條點擊記錄的域名為節點引出1條有向邊,同時更新上一條點擊記錄中域名的停留時間;
2.4)重復2.1)到2.3)直到所有點擊記錄被讀取,即可構建加權有向注意力流網絡G:G=(V,E,T,W),其中V為節點集,即記錄中存在的所有域名與虛擬節點Source和虛擬節點Sink構成的節點集合;E為邊集,即記錄不同域名之間跳轉的邊集合;T為域名停留時間集,表示群體用戶在一個域名上停留的總時間;W為邊集E的權重,記錄不同域名之間跳轉關系發生次數的集合;
3)由步驟2)構建的加權有向注意力流網絡G,計算得出注意力流矩陣M,計算公式為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘭州七度數聚技術有限公司,未經蘭州七度數聚技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011266716.8/2.html,轉載請聲明來源鉆瓜專利網。





