[發(fā)明專利]一種基于訓(xùn)練數(shù)據(jù)挖掘的位置預(yù)測方法有效
| 申請?zhí)枺?/td> | 202110114662.1 | 申請日: | 2021-01-26 |
| 公開(公告)號: | CN112800111B | 公開(公告)日: | 2022-08-02 |
| 發(fā)明(設(shè)計(jì))人: | 蘇暢;馮昊祥;謝顯中 | 申請(專利權(quán))人: | 重慶郵電大學(xué) |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06F16/29;G06N3/04;G06N3/08 |
| 代理公司: | 北京同恒源知識產(chǎn)權(quán)代理有限公司 11275 | 代理人: | 趙榮之 |
| 地址: | 400065 *** | 國省代碼: | 重慶;50 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 訓(xùn)練 數(shù)據(jù) 挖掘 位置 預(yù)測 方法 | ||
本發(fā)明涉及一種基于訓(xùn)練數(shù)據(jù)挖掘的位置預(yù)測方法,屬于位置預(yù)測領(lǐng)域。該方法包括:S1:獲取用戶?位置交互數(shù)據(jù);S2:分別對用戶和位置的特征進(jìn)行embedding;S3:選擇正負(fù)樣本;S4:使用基于流行度原則和信息量公式的負(fù)樣本抽樣算法抽取部分負(fù)樣本;S5:通過兩種不同的策略來挖掘Hard negative;S6:構(gòu)建Hard selection strategy來訓(xùn)練負(fù)樣本;S7:構(gòu)建NDA?GAN模型;S8:運(yùn)用訓(xùn)練好的NDA?GAN模型進(jìn)行位置預(yù)測,得到TOP?K排序,預(yù)測用戶下一時(shí)刻可能訪問的地點(diǎn)序列。本發(fā)明能夠更加準(zhǔn)確的預(yù)測用戶將會訪問的位置,提高位置預(yù)測系統(tǒng)的性能。
技術(shù)領(lǐng)域
本發(fā)明屬于位置預(yù)測領(lǐng)域,涉及一種基于NDA-GAN(負(fù)樣本增強(qiáng)生成對抗網(wǎng)絡(luò))和深度學(xué)習(xí)的位置預(yù)測方法。
背景技術(shù)
近年來,LBSN發(fā)展十分迅速,通過天氣時(shí)間社交等信息特征來預(yù)測用戶的訪問位置,根據(jù)用戶的下個(gè)訪問位置來進(jìn)行其他應(yīng)用,例如交通擁堵、位置推薦等,從而也推進(jìn)了社交網(wǎng)絡(luò)的發(fā)展。隨著信息技術(shù)的快速發(fā)展,在位置預(yù)測系統(tǒng)中用戶的信息變得多元化,各種各樣的輔助信息可以被利用,從社交網(wǎng)絡(luò)信息到天氣信息、從時(shí)間信息到運(yùn)動軌跡信息,從朋友信息到興趣相投的陌生人信息,這些信息維度隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展越來越高,從而使得位置預(yù)測系統(tǒng)能夠更加準(zhǔn)確的去描述用戶和位置的特征,提升用戶在位置預(yù)測系統(tǒng)中所提供服務(wù)的體驗(yàn)。
在位置預(yù)測領(lǐng)域,有很多研究者在該領(lǐng)域取得不錯的效果,從傳統(tǒng)的機(jī)器學(xué)習(xí)方法到深度學(xué)習(xí)方法都占有一席之地。隨著LBSN的迅速發(fā)展,從Top-k預(yù)測到社交關(guān)系再到長短期時(shí)序性預(yù)測,位置預(yù)測系統(tǒng)考慮的對象逐漸從評分?jǐn)?shù)據(jù)轉(zhuǎn)向用戶和位置的時(shí)序性的特征,因而位置預(yù)測系統(tǒng)所需處理多維數(shù)據(jù)的能力顯得尤為重要。大多數(shù)位置預(yù)測系統(tǒng)利用提取到的用戶特征和位置特征,通過這些特征預(yù)測用戶下一時(shí)刻可能訪問的位置,因而數(shù)據(jù)量和特征是準(zhǔn)確的預(yù)測用戶下一時(shí)刻可能訪問位置的重要因素。
現(xiàn)如今,有較多研究把深度學(xué)習(xí)運(yùn)用于位置預(yù)測系統(tǒng),通過深度學(xué)習(xí)提取用戶與位置的潛在特征,但沒有考慮LBSN簽到數(shù)據(jù)集的正負(fù)樣本不平衡問題,不能夠?qū)τ脩?位置之間的關(guān)系進(jìn)行深入地挖掘,推薦效果不佳。基于生成對抗網(wǎng)絡(luò)的對抗式負(fù)樣本生成可以有效起到擴(kuò)充數(shù)據(jù)集的作用,作為樣本生成的重要方法之一,生成式對抗網(wǎng)絡(luò)(GAN)可以根據(jù)任意給定數(shù)據(jù)集中的數(shù)據(jù)分布生成樣本,但它在實(shí)際的訓(xùn)練過程中存在生成樣本紋理模糊,訓(xùn)練過程不穩(wěn)定以及模式坍塌等問題。而負(fù)樣本對于預(yù)測結(jié)果的精確性起到了至關(guān)重要的作用,負(fù)樣本的引入可以極大程度上提高預(yù)測的精度問題并解決普遍存在的數(shù)據(jù)稀疏問題,因此,如何提取有效且可置信的負(fù)樣本成為目前亟需解決的問題。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的在于提供一種基于訓(xùn)練數(shù)據(jù)挖掘的位置預(yù)測方法,更加準(zhǔn)確的預(yù)測用戶將會訪問的位置,提高位置預(yù)測系統(tǒng)的性能。
為達(dá)到上述目的,本發(fā)明提供如下技術(shù)方案:
一種基于訓(xùn)練數(shù)據(jù)挖掘的位置預(yù)測方法,具體包括以下步驟:
S1:獲取用戶-位置交互數(shù)據(jù);
S2:分別對用戶和位置的特征進(jìn)行embedding;
S3:選擇正負(fù)樣本;
S4:使用基于流行度原則和信息量公式的負(fù)樣本抽樣算法抽取部分負(fù)樣本;
S5:通過兩種不同的策略來挖掘Hard negative;
S6:構(gòu)建Hard selection strategy來訓(xùn)練負(fù)樣本;
S7:使用正負(fù)樣本訓(xùn)練生成對抗網(wǎng)絡(luò)模型,形成負(fù)樣本增強(qiáng)生成對抗網(wǎng)絡(luò)(NDA-GAN)模型,使其能夠辨別正負(fù)樣本,并生成可置信數(shù)據(jù);
S8:運(yùn)用訓(xùn)練好的NDA-GAN模型進(jìn)行位置預(yù)測,得到TOP-K排序,預(yù)測用戶下一時(shí)刻可能訪問的地點(diǎn)序列。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于重慶郵電大學(xué),未經(jīng)重慶郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110114662.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





