[發明專利]一種基于深度遷移學習和跨域數據融合的無線蜂窩網絡流量預測方法有效
| 申請號: | 202011099886.1 | 申請日: | 2020-10-15 |
| 公開(公告)號: | CN112291807B | 公開(公告)日: | 2022-09-23 |
| 發明(設計)人: | 陳賡;曾慶田;孫強;段華;邵睿;徐先杰;張旭 | 申請(專利權)人: | 山東科技大學 |
| 主分類號: | H04W24/06 | 分類號: | H04W24/06;H04L41/14;H04L41/147;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 青島智地領創專利代理有限公司 37252 | 代理人: | 肖峰 |
| 地址: | 266590 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 遷移 學習 數據 融合 無線 蜂窩 網絡流量 預測 方法 | ||
1.一種基于深度遷移學習和跨域數據融合的無線蜂窩網絡流量預測方法,其特征在于,包括如下步驟:
步驟1:對短信、電話、互聯網三種業務數據進行矩陣化處理和皮爾遜相關性分析;具體包括如下步驟:
步驟1.1:將短信、電話、互聯網三種業務數據的處理結果用大小相同的三個矩陣來表示,即100×100的矩陣,矩陣中的每一個元素代表某一種業務的流量數據值;將無線流量數據類型表示為k,其中,k∈{Sms,Call,Internet},將預測區域的無線業務流量表示成一個t維的張量,T為時間間隔總數,t={1,2,...,T},X,Y分別代表該預測區域的坐標點,第t個時隙的預測區域流量矩陣Dk,t為公式(1):
步驟1.2:分析短信、電話、互聯網三種業務數據之間的相關性,分析不同業務數據的周期性、差異性和不同區域數據的差異性;
步驟2:對不同區域進行網格化劃分,并對其進行聚簇分類;具體包括如下步驟:
步驟2.1:對所預測的區域劃分成100×100的柵格區域,每個柵格對應某個業務的無線蜂窩流量的數據值;
步驟2.2:根據不同區域的無線蜂窩流量的相似性和差異性,將相似的區域聚到一起,得到三個不同的類,然后對不同的類進行模型訓練;
步驟3:對跨域數據進行相關性分析和矩陣化處理,并進行融合;具體包括如下步驟:
步驟3.1:將獲取到的社交信息、基站分布、興趣點分布三種跨域數據集處理成100×100的三個矩陣;對數據集處理之后,根據坐標信息將數據映射到具體的區域,得到公式(2),跨域數據集Dcross表示如下:
其中,Dcross是由基站信息DBS、興趣點分布DPOI、社交信息DSocial三類數據通過拼接操作處理成一個新的張量;
步驟3.2:通過皮爾遜相關系數分析,得到跨域數據和不同業務數據的相關性、相似性及相關度特征;其中,皮爾遜相關系數ρ計算公式如下:
其中,cov(·)表示協方差,σ表示標準差;
步驟3.3:將矩陣化處理后的三種跨域數據封裝成一個張量;
步驟4:對無線蜂窩流量的時間戳進行特征提取;步驟4具體包括如下步驟:
步驟4.1:在無線蜂窩流量的時間戳中提取星期、小時、工作日、周末四個特征屬性并處理成一個向量;
步驟4.2:將處理的向量轉變成一個100×100的矩陣;
步驟5:將多種數據和業務數據融合并輸入到時空跨域神經網絡模型;具體包括如下步驟:
步驟5.1:對不同業務的蜂窩流量進行時空相關性建模;對時間戳進行特征建模;對跨域數據進行空間相關性建模;
步驟5.2:將上述三種建模進行特征融合,并按照指定維度拼接成一個新的張量T;
步驟5.3:將處理好的張量輸入到時空跨域神經網絡模型中;
步驟6:采用跨業務和區域融合遷移學習策略進一步提高無線蜂窩流量預測的精度;具體包括如下步驟:
步驟6.1:將某個業務數據導入到時空跨域神經網絡模型中進行訓練,得到模型的訓練參數1;
步驟6.2:將模型的訓練參數1作為另一種業務的聚簇后的第一類的初始參數,然后導入時空跨域神經網絡模型中進行訓練參數,得到訓練參數2;
步驟6.3:將模型的訓練參數2作為另一種業務的聚簇后的第二類的初始參數,然后導入時空跨域神經網絡模型中進行訓練參數,得到訓練參數3;
步驟6.4:將模型的訓練參數3作為另一種業務的聚簇后的第三類的初始參數,然后導入時空跨域神經網絡模型中進行訓練參數,得到訓練結果;
步驟6.5:輸入測試集數據通過訓練好的模型進行測試,得到最終的預測結果;
其中,模型訓練的過程中conv-LSTM的關鍵運算如下:
其中,為輸入門,為遺忘門,為輸出門,σ(·)為激活函數,*為卷積操作,⊙為Hadamard乘積運算,W(·)為訓練的權重,C(·)為conv-LSTM網絡層的存儲單元,H(·)為輸出門的隱藏狀態,b(·)為訓練的偏置,tanh(·)為雙曲正切函數,Cτ、Hτ都是一個三維張量,經過conv-LSTM網絡層的得到的輸出H為特征圖數量;
時間戳Dmeta的初步特征Ometa的處理過程如下:
ometa=Reshape(ometa) (6)
其中,σ(·)為激活函數,和是待學習的參數;經過一個兩層的全連接層處理后,Reshape的作用是將Ometa矩陣變換成與ot大小一致的張量;
跨域數據集Dcorss的初步特征Ocross表示為:
ocross=f(Wcross*Dcross) (7)
其中,是拼接操作,Wcross為待學習的參數,f(·)為一個復合函數,包含批正則化、Relu激活函數和卷積操作,Dcross是由基站信息DBS、興趣點分布DPOI、社交信息DSocial三類數據通過拼接操作處理成一個新的張量,對Dcross進行卷積和非線性變化,處理成與ot、Ometa的大小相一致;
最終輸出的產生的Frobenius范數計算式:
其中,θ是STC-N的所有參數的集合,argmin函數實現預測值和真實值的最小化。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東科技大學,未經山東科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011099886.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種建筑樓板自動測厚標記裝置
- 下一篇:一種汽車車身柔性化套色涂裝方法





