[發明專利]一種基于訓練數據挖掘的位置預測方法有效
| 申請號: | 202110114662.1 | 申請日: | 2021-01-26 |
| 公開(公告)號: | CN112800111B | 公開(公告)日: | 2022-08-02 |
| 發明(設計)人: | 蘇暢;馮昊祥;謝顯中 | 申請(專利權)人: | 重慶郵電大學 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06F16/29;G06N3/04;G06N3/08 |
| 代理公司: | 北京同恒源知識產權代理有限公司 11275 | 代理人: | 趙榮之 |
| 地址: | 400065 *** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 訓練 數據 挖掘 位置 預測 方法 | ||
1.一種基于訓練數據挖掘的位置預測方法,其特征在于,該方法具體包括以下步驟:
S1:獲取用戶-位置交互數據;
S2:分別對用戶和位置的特征進行embedding;
S3:選擇正負樣本;
S4:使用基于流行度原則和信息量公式的負樣本抽樣算法抽取部分負樣本,具體包括:首先根據每一個數據集的簽到情況篩選出流行度高的位置列表,判斷用戶是否進行過簽到,然后再結合信息量公式為每個用戶從列表中抽取負樣本;
其中,信息量公式為:
δ=-log pj
其中,δ表示信息量,pj表示用戶p訪問位置j的概率;在進行負樣本抽樣時要滿足在同一時刻用戶沒有簽到記錄;
S5:通過兩種不同的策略來挖掘Hard negative;
S6:構建Hard selection strategy來訓練負樣本;
S7:使用正負樣本訓練生成對抗網絡模型,形成負樣本增強生成對抗網絡NDA-GAN模型,使其能夠辨別正負樣本,并生成可置信數據;
形成負樣本增強生成對抗網絡NDA-GAN模型,具體包括:根據步驟S3~S6的方式選取出負樣本后,根據每個用戶和訪問地點之間的邏輯關系構建用于生成負樣本的生成對抗網絡NDA-GAN,生成網絡由一個編碼器組成,它獲取一條輸入數據xi,并將其映射到一個低維向量上;隨機向量zi映射到同一維度后與該輸入數據向量拼接,然后共同傳遞到解碼器網絡之中,解碼器生成數據;對抗性判別器網絡被訓練用于區分來自真實數據分布的樣本和偽分布;過程如下:
(1)隨機初始化向量zi,其中z是滿足高斯分布的變量,如下公式所示:
z=N(0,I)
(2)生成數據:
v=f(z)
其中,f表示神經網絡訓練的實現,v是正在生成的向量;
(3)向判別器提供不同于生成器輸入的xi但是來自于同一類的輸入xj同時,不提供有關負樣本類的信息,生成器必須學習與該負樣本類能夠保持一致的特征并歸納;
(4)建立損失函數,選取二分類問題常用損失函數BCELoss,公式如下:
loss(xi,yi)=-wi[yilogxi+(1-yi)log(1-xi)]
其中,ploss表示總體損失,表示真實數據損失,表示生成數據損失,output表示生成數據,lablereal表示條件對應標簽,loss(xi,yi)表示損失值,wi表示權值,yi表示條件對應標簽;
S8:運用訓練好的NDA-GAN模型進行位置預測,得到TOP-K排序,預測用戶下一時刻可能訪問的地點序列。
2.根據權利要求1所述的位置預測方法,其特征在于,步驟S1中,獲取的數據包括:用戶、溫度、經緯度、周、月、訪問時長、降水量和風速;
關系對包括:{用戶:周,用戶:月,用戶:用戶,用戶:訪問時長,位置:降水量,位置:風速,位置:溫度}。
3.根據權利要求1所述的位置預測方法,其特征在于,步驟S3中,正樣本的選擇方式為:使用已訪問過的位置作為正樣本;
負樣本的選擇方式為:
(1)隨機取樣,對于每個訪問,從數據集中隨機抽取位置作為負樣本;
(2)對于每個訪問,隨機抽取處于召回前列卻沒有被訪問的位置結果作為負樣本。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶郵電大學,未經重慶郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110114662.1/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





