[發明專利]基于注意力流網絡模型的互聯網站點影響力的定量評估方法有效
| 申請號: | 202011266716.8 | 申請日: | 2020-11-13 |
| 公開(公告)號: | CN112380465B | 公開(公告)日: | 2022-11-11 |
| 發明(設計)人: | 李勇;薛向軍;張小康;火胤 | 申請(專利權)人: | 蘭州七度數聚技術有限公司 |
| 主分類號: | G06F16/955 | 分類號: | G06F16/955;G06F16/958;H04L43/106 |
| 代理公司: | 蘭州中科華西專利代理有限公司 62002 | 代理人: | 馬小瑞 |
| 地址: | 730070 甘肅省蘭州市安寧區萬新*** | 國省代碼: | 甘肅;62 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 注意力 流網 模型 互聯網 站點 影響力 定量 評估 方法 | ||
1.基于注意力流網絡模型的互聯網站點影響力的定量評估方法,其特征在于:對海量群體用戶的在線點擊流數據進行數據清洗,得到用戶的注意力轉移序列;構建群體注意力流網絡;計算注意力流矩陣M、概率轉移矩陣P、注意力耗散矩陣Q和基本矩陣U;計算互聯網站點影響力Ci;通過以下步驟實現:
1)數據預處理:
逐一提取海量群體用戶在線點擊流數據中每個用戶的瀏覽器進程記錄,保存每個用戶點擊流數據記錄中存在的統一資源定位器URL和時間戳;從所保存的統一資源定位器URL中抽取出域名信息,將時間戳轉換為對應的點擊時間,得到清洗后的數據,清洗后的數據包括域名信息和點擊時間兩部分;
2)加權有向注意力流網絡的構建:
2.1)逐一讀取數據預處理過程中得到的每個用戶點擊流數據序列,建立一個虛擬節點Source以表示注意力流的“源”,從虛擬節點Source向第1條點擊記錄的域名引出1條有向邊;
2.2)判斷下一條點擊記錄與上一條點擊記錄的時間差,如果超過30分鐘,則以上一條點擊記錄的域名為節點,引出1條有向邊到一個虛擬節點Sink,虛擬節點Sink表示注意力流的“匯”;從虛擬節點Source向下一條點擊記錄中的域名為節點引出1條有向邊,同時更新上一條記錄的域名停留時間,如果沒有超過30分鐘,則執行步驟2.3);
2.3)判斷下一條點擊記錄與上一條點擊記錄的域名是否相同,如果相同,則更新該域名的停留時間,如果不同,則以上一條點擊記錄的域名為節點向下一條點擊記錄的域名為節點引出1條有向邊,同時更新上一條點擊記錄中域名的停留時間;
2.4)重復2.1)到2.3)直到所有點擊記錄被讀取,即可構建加權有向注意力流網絡G:G=(V,E,T,W),其中V表示節點集,即記錄中存在的所有域名與虛擬節點Source和虛擬節點Sink構成的節點集合;E表示邊集,即記錄不同域名之間跳轉的邊集合;T表示群體用戶在一個域名上停留的總時間;W表示邊集E中各個邊的權重,記錄群體用戶在不同域名之間跳轉關系發生次數的集合;
3)由步驟2)構建的加權有向注意力流網絡G,計算得出注意力流矩陣M,計算公式為:
M(n+2)×(n+2)={Wij}(n+2)×(n+2)
其中Wij表示從域名i到域名j的注意力流強度;
4)通過步驟3)得出的注意力流矩陣M,計算得出馬爾可夫鏈概率轉移矩陣P,計算公式為:
Pij=Wij/∑kWik
其中Pij表示域名i和域名j之間一步的轉移概率;
5)由步驟2)構建的加權有向注意力流網絡G,定義注意力流的總時長Ti,計算公式為:
其中Ti表示所有用戶在域名i上的總停留時間,即域名i吸引群體用戶注意力的總時間,以秒為單位,k代表所有用戶構成的集合;引入一個衰減因子αi,衰減因子αi的計算公式為:
其中αi表示一個特定域名i對注意力流的耗散能力,用以度量域名吸引用戶注意力的能力;
6)通過步驟4)得到的馬爾可夫鏈概率轉移矩陣P和步驟5)得到的衰減因子αi計算矩陣Q,矩陣Q的計算公式為:
Qij=αiPij,i,j∈V;
7)由矩陣Q計算基本矩陣U,計算公式為:
其中I表示單位矩陣;
8)通過步驟7)中求得的基本矩陣U計算域名影響力Ci,計算公式為:
其中uij表示基本矩陣U中的元素,Fi具體計算公式為:
Fi表示從虛擬節點Source流到域名i的注意力總流量,w0j表示從虛擬節點Source流到域名j的注意力總流量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘭州七度數聚技術有限公司,未經蘭州七度數聚技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011266716.8/1.html,轉載請聲明來源鉆瓜專利網。





