[發明專利]一種基于生成對抗網絡的軌跡數據分類方法有效
| 申請號: | 201810372762.2 | 申請日: | 2018-04-24 |
| 公開(公告)號: | CN108564129B | 公開(公告)日: | 2020-09-08 |
| 發明(設計)人: | 周帆;殷睿陽;鐘婷 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 成都虹盛匯泉專利代理有限公司 51268 | 代理人: | 王偉 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 生成 對抗 網絡 軌跡 數據 分類 方法 | ||
本發明公開了一種基于生成對抗網絡的軌跡數據分類方法,首先將真實軌跡數據輸入生成對抗網絡,使生成對抗網絡訓練至生成器生成與真實軌跡數據分布相同的仿真軌跡數據;然后利用生成對抗網絡的生成器生成若干組仿真軌跡數據;最好對生成的若干組仿真軌跡數據與真實軌跡數據一起進行分類處理,得到軌跡用戶映射。本發明通過生成對抗網絡可以模擬真實軌跡數據的分布,以生成的仿真軌跡數據和真實軌跡數據一起作為軌跡數據分類的數據源,對軌跡數據進行分類,可以有效解決數據稀疏問題,避免稀疏軌跡數據對軌跡數據分類產生的負面影響;由于稀疏軌跡數據也存在相應的軌跡用戶映射,因此能夠實現對稀疏軌跡數據分類有助于提高數據分類效果。
技術領域
本發明屬于機器學習中的深度學習領域,涉及一種基于機器學習的軌跡數據方法,尤其涉及一種基于對抗學習進行數據增強,從而提升軌跡數據分類效果的數據處理方法。
背景技術
隨著人類生活中智能手機、可穿戴智能設備的普及,越來越多的基于位置的社交網絡(LBSNs)數據被挖掘。對這些數據按照用戶進行分類是一個非常重要的研究方向,分類的結果對廣告或地點用戶的精準推薦,甚至對于追蹤失蹤人口都有巨大的用處。
傳統的機器學習方法使用SVM、LDA、LCSS等算法對數據進行分類。而當今社會是一個大數據的時代,在海量數據的前提下,傳統機器學習算法對于計算機內存的消耗讓很多計算機設備難以承受,而深度學習不僅可以輕松地處理海量的數據,并且還可以達到優于傳統機器學習算法的效果。使用循環神經網絡(RNN)或者其變體長短期記憶網絡(LSTM)將軌跡按用戶類別進行分類(如圖1所示),達到的分類效果要好于傳統的機器學習算法,具體處理過程如下:將進行預處理(包括刪除過長數據和刪除數據量較少的用戶)后的軌跡數據,例如圖1中的T11(用戶1的第一條軌跡)、T21(用戶1的第二條軌跡)、T12(用戶2的第一條軌跡)、T22(用戶2的第二條軌跡)……;使用Word2vec技術進行詞向量的轉換,將離散的軌跡點轉化為連續空間中的向量(這些向量中包含了數據的上下文信息,也就代表了原始數據之間的關系),處理后的軌跡向量可以正確表示出原有軌跡數據中前一軌跡點和后一軌跡點之間的某種聯系;再將向量化的數據輸入到循環神經網絡(Recurrent Neural Network,RNN)中,從循環神經網絡中輸出的信息輸入到一個全連接層中,通過使用softmax激活函數進行分類操作,便得到了該軌跡所屬的用戶ID【Q.Gao,F.Zhou,K.Zhang,G.Trajcevski,X,Luo,and F.Zhang,“Identifying Human Mobility via Trajectory Embeddings”2016】。對于當今社會產生的海量數據而言,即使上述軌跡分類方法沒有包含調參等步驟,深度學習達到的效果已經優于傳統的機器學習算法。
深度學習對比傳統機器學習方法的優點是可以更加有效地處理海量數據,然而真實的軌跡數據集中,有些用戶的軌跡數據豐富,而另一些用戶的軌跡數據卻很稀疏。在稀疏的數據上不足以體現出深度學習的優勢,甚至會對神經網絡的訓練造成負面影響。因此對軌跡數據進行預處理是為了去除稀疏數據對神經網絡訓練帶來的負面影響。然而去除稀疏軌跡數據必然影響對真實軌跡數據的分類效果,從而影響其在實際生活中的應用。因此為了使深度學習真正意義上地可以應用在實際生活的問題中,必須處理好稀疏數據對神經網絡帶來的負面影響,而不僅僅是刪除它們。
發明內容
本發明的目的旨在克服現有技術中軌跡數據分類方法存在的難以對稀疏數據進行有效分類的缺陷,提供一種基于生成對抗網絡的軌跡數據分類方法,以解決因真實軌跡數據稀疏性對神經網絡訓練帶來的負面影響,提高深度學習對軌跡數據的分類效果,從而更加適用于實際應用。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810372762.2/2.html,轉載請聲明來源鉆瓜專利網。





