[發(fā)明專利]一種基于生成對抗網(wǎng)絡(luò)的軌跡數(shù)據(jù)分類方法有效
| 申請?zhí)枺?/td> | 201810372762.2 | 申請日: | 2018-04-24 |
| 公開(公告)號: | CN108564129B | 公開(公告)日: | 2020-09-08 |
| 發(fā)明(設(shè)計)人: | 周帆;殷睿陽;鐘婷 | 申請(專利權(quán))人: | 電子科技大學(xué) |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 成都虹盛匯泉專利代理有限公司 51268 | 代理人: | 王偉 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 生成 對抗 網(wǎng)絡(luò) 軌跡 數(shù)據(jù) 分類 方法 | ||
本發(fā)明公開了一種基于生成對抗網(wǎng)絡(luò)的軌跡數(shù)據(jù)分類方法,首先將真實軌跡數(shù)據(jù)輸入生成對抗網(wǎng)絡(luò),使生成對抗網(wǎng)絡(luò)訓(xùn)練至生成器生成與真實軌跡數(shù)據(jù)分布相同的仿真軌跡數(shù)據(jù);然后利用生成對抗網(wǎng)絡(luò)的生成器生成若干組仿真軌跡數(shù)據(jù);最好對生成的若干組仿真軌跡數(shù)據(jù)與真實軌跡數(shù)據(jù)一起進行分類處理,得到軌跡用戶映射。本發(fā)明通過生成對抗網(wǎng)絡(luò)可以模擬真實軌跡數(shù)據(jù)的分布,以生成的仿真軌跡數(shù)據(jù)和真實軌跡數(shù)據(jù)一起作為軌跡數(shù)據(jù)分類的數(shù)據(jù)源,對軌跡數(shù)據(jù)進行分類,可以有效解決數(shù)據(jù)稀疏問題,避免稀疏軌跡數(shù)據(jù)對軌跡數(shù)據(jù)分類產(chǎn)生的負面影響;由于稀疏軌跡數(shù)據(jù)也存在相應(yīng)的軌跡用戶映射,因此能夠?qū)崿F(xiàn)對稀疏軌跡數(shù)據(jù)分類有助于提高數(shù)據(jù)分類效果。
技術(shù)領(lǐng)域
本發(fā)明屬于機器學(xué)習(xí)中的深度學(xué)習(xí)領(lǐng)域,涉及一種基于機器學(xué)習(xí)的軌跡數(shù)據(jù)方法,尤其涉及一種基于對抗學(xué)習(xí)進行數(shù)據(jù)增強,從而提升軌跡數(shù)據(jù)分類效果的數(shù)據(jù)處理方法。
背景技術(shù)
隨著人類生活中智能手機、可穿戴智能設(shè)備的普及,越來越多的基于位置的社交網(wǎng)絡(luò)(LBSNs)數(shù)據(jù)被挖掘。對這些數(shù)據(jù)按照用戶進行分類是一個非常重要的研究方向,分類的結(jié)果對廣告或地點用戶的精準(zhǔn)推薦,甚至對于追蹤失蹤人口都有巨大的用處。
傳統(tǒng)的機器學(xué)習(xí)方法使用SVM、LDA、LCSS等算法對數(shù)據(jù)進行分類。而當(dāng)今社會是一個大數(shù)據(jù)的時代,在海量數(shù)據(jù)的前提下,傳統(tǒng)機器學(xué)習(xí)算法對于計算機內(nèi)存的消耗讓很多計算機設(shè)備難以承受,而深度學(xué)習(xí)不僅可以輕松地處理海量的數(shù)據(jù),并且還可以達到優(yōu)于傳統(tǒng)機器學(xué)習(xí)算法的效果。使用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)或者其變體長短期記憶網(wǎng)絡(luò)(LSTM)將軌跡按用戶類別進行分類(如圖1所示),達到的分類效果要好于傳統(tǒng)的機器學(xué)習(xí)算法,具體處理過程如下:將進行預(yù)處理(包括刪除過長數(shù)據(jù)和刪除數(shù)據(jù)量較少的用戶)后的軌跡數(shù)據(jù),例如圖1中的T11(用戶1的第一條軌跡)、T21(用戶1的第二條軌跡)、T12(用戶2的第一條軌跡)、T22(用戶2的第二條軌跡)……;使用Word2vec技術(shù)進行詞向量的轉(zhuǎn)換,將離散的軌跡點轉(zhuǎn)化為連續(xù)空間中的向量(這些向量中包含了數(shù)據(jù)的上下文信息,也就代表了原始數(shù)據(jù)之間的關(guān)系),處理后的軌跡向量可以正確表示出原有軌跡數(shù)據(jù)中前一軌跡點和后一軌跡點之間的某種聯(lián)系;再將向量化的數(shù)據(jù)輸入到循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)中,從循環(huán)神經(jīng)網(wǎng)絡(luò)中輸出的信息輸入到一個全連接層中,通過使用softmax激活函數(shù)進行分類操作,便得到了該軌跡所屬的用戶ID【Q.Gao,F.Zhou,K.Zhang,G.Trajcevski,X,Luo,and F.Zhang,“Identifying Human Mobility via Trajectory Embeddings”2016】。對于當(dāng)今社會產(chǎn)生的海量數(shù)據(jù)而言,即使上述軌跡分類方法沒有包含調(diào)參等步驟,深度學(xué)習(xí)達到的效果已經(jīng)優(yōu)于傳統(tǒng)的機器學(xué)習(xí)算法。
深度學(xué)習(xí)對比傳統(tǒng)機器學(xué)習(xí)方法的優(yōu)點是可以更加有效地處理海量數(shù)據(jù),然而真實的軌跡數(shù)據(jù)集中,有些用戶的軌跡數(shù)據(jù)豐富,而另一些用戶的軌跡數(shù)據(jù)卻很稀疏。在稀疏的數(shù)據(jù)上不足以體現(xiàn)出深度學(xué)習(xí)的優(yōu)勢,甚至?xí)ι窠?jīng)網(wǎng)絡(luò)的訓(xùn)練造成負面影響。因此對軌跡數(shù)據(jù)進行預(yù)處理是為了去除稀疏數(shù)據(jù)對神經(jīng)網(wǎng)絡(luò)訓(xùn)練帶來的負面影響。然而去除稀疏軌跡數(shù)據(jù)必然影響對真實軌跡數(shù)據(jù)的分類效果,從而影響其在實際生活中的應(yīng)用。因此為了使深度學(xué)習(xí)真正意義上地可以應(yīng)用在實際生活的問題中,必須處理好稀疏數(shù)據(jù)對神經(jīng)網(wǎng)絡(luò)帶來的負面影響,而不僅僅是刪除它們。
發(fā)明內(nèi)容
本發(fā)明的目的旨在克服現(xiàn)有技術(shù)中軌跡數(shù)據(jù)分類方法存在的難以對稀疏數(shù)據(jù)進行有效分類的缺陷,提供一種基于生成對抗網(wǎng)絡(luò)的軌跡數(shù)據(jù)分類方法,以解決因真實軌跡數(shù)據(jù)稀疏性對神經(jīng)網(wǎng)絡(luò)訓(xùn)練帶來的負面影響,提高深度學(xué)習(xí)對軌跡數(shù)據(jù)的分類效果,從而更加適用于實際應(yīng)用。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于電子科技大學(xué),未經(jīng)電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810372762.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 農(nóng)業(yè)信息對抗資源目標(biāo)規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對抗資源模糊規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對抗資源線性規(guī)劃最優(yōu)分配方法
- 基于聚類數(shù)據(jù)挖掘的對抗行為搜索算法
- 面向多種對抗圖片攻擊的協(xié)同免疫防御方法
- 一種自適應(yīng)對抗強度的對抗訓(xùn)練方法
- 對抗攻擊模型的訓(xùn)練方法及裝置
- 對抗樣本的生成方法和裝置
- 多樣本對抗擾動生成方法、裝置、存儲介質(zhì)和計算設(shè)備
- 一種無人集群協(xié)同博弈對抗的控制方法及系統(tǒng)
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲介質(zhì)及移動終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





