[發(fā)明專利]一種基于A-TrAdaboost算法的多源社區(qū)標(biāo)簽發(fā)展趨勢預(yù)測方法有效
| 申請?zhí)枺?/td> | 201810453513.6 | 申請日: | 2018-05-14 |
| 公開(公告)號: | CN108764537B | 公開(公告)日: | 2021-11-23 |
| 發(fā)明(設(shè)計)人: | 傅晨波;鄭永立;趙明浩;宣琦 | 申請(專利權(quán))人: | 浙江工業(yè)大學(xué) |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q50/00;G06K9/62 |
| 代理公司: | 杭州斯可睿專利事務(wù)所有限公司 33241 | 代理人: | 王利強 |
| 地址: | 310014 浙江省*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 tradaboost 算法 社區(qū) 標(biāo)簽 發(fā)展趨勢 預(yù)測 方法 | ||
一種基于A?TrAdaboost算法的多源社區(qū)標(biāo)簽發(fā)展趨勢預(yù)測方法,包括以下步驟:(1)構(gòu)建問答社區(qū)中的標(biāo)簽網(wǎng)絡(luò);(2)計算源領(lǐng)域社區(qū)和目標(biāo)領(lǐng)域社區(qū)結(jié)構(gòu)的向量表征(3)計算源領(lǐng)域與目標(biāo)領(lǐng)域之間的結(jié)構(gòu)相似性;(4)構(gòu)建基于A?TrAdaboost算法的多源社區(qū)標(biāo)簽流行性預(yù)測模型。本發(fā)明利用網(wǎng)絡(luò)圖表征的方法,得到各個網(wǎng)絡(luò)的向量表征,進而計算網(wǎng)絡(luò)之間的相似性,作為不同問答社區(qū)之間的領(lǐng)域距離,并將網(wǎng)絡(luò)結(jié)構(gòu)之間的相似性作為多源遷移學(xué)習(xí)算法TrAdaboost的初始權(quán)重,在進行跨社區(qū)預(yù)測新標(biāo)簽流行性問題時,能夠較好的避免多源遷移中的負(fù)遷移問題,提高模型的訓(xùn)練時間和精度。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)挖掘、圖結(jié)構(gòu)分析技術(shù),特別是涉及一種基于A-TrAdaboost 算法的多源社區(qū)標(biāo)簽發(fā)展趨勢預(yù)測方法。
背景技術(shù)
當(dāng)前隨著移動互聯(lián)網(wǎng)和智能設(shè)備的廣泛普及,改變了人們的生活方式,人們 更傾向于在網(wǎng)絡(luò)上發(fā)表自己看法和搜集自己需要的信息,因此在線問答社區(qū)變得 越來越活躍和流行。由于問答社區(qū)中的帖子數(shù)量巨大,用戶在問答社區(qū)中獲取的 信息主要根據(jù)問題答案的標(biāo)簽來進行篩選和推薦,隨著時間的推移,標(biāo)簽的數(shù)量 也越來與巨大,問答社區(qū)中的標(biāo)簽研究日益成為關(guān)注的熱點。
傅晨波等人(見文獻[1]Fu C,Zheng Y,Li S,et al.Predicting the popularityof tags in StackExchange QA communities[C]//Complex Systems and Networks(IWCSN),2017International Workshop on.IEEE,2017:90-95.即傅晨波,鄭永立,李 詩迪.預(yù)測StackExchange問答社區(qū)標(biāo)簽流行性[C]//復(fù)雜的系統(tǒng)和網(wǎng)絡(luò) (IWCSN),2017國際研討會.IEEE,2017:90-95。)已經(jīng)研究了問答社區(qū)中新標(biāo)簽未 來的流行性發(fā)展趨勢預(yù)測,但是其預(yù)測模型僅根據(jù)單個社區(qū)中標(biāo)簽數(shù)據(jù)來進行模 型構(gòu)建。在這種情況下,當(dāng)在一些數(shù)據(jù)量較小的社區(qū)或者新出現(xiàn)的社區(qū)中使用模 型時,由于標(biāo)記數(shù)據(jù)樣本較少,會使得訓(xùn)練后的模型并不理想。遷移學(xué)習(xí)從一個 相關(guān)并同時擁有豐富訓(xùn)練樣本的領(lǐng)域中訓(xùn)練模型,并分享到目標(biāo)領(lǐng)域。利用遷移 學(xué)習(xí)可以解決目標(biāo)領(lǐng)域訓(xùn)練數(shù)據(jù)較少的缺陷。因此我們利用遷移學(xué)習(xí)的思路在其 他較大社區(qū)中進行模型訓(xùn)練,然后再遷移到目標(biāo)社區(qū),以提高預(yù)測模型的精度。
單源遷移時常常會遇到負(fù)遷移的狀況,使得遷移過來的效果并不好。為了解 決這一問題,其中一種方法是設(shè)置不同的樣本權(quán)重,通過設(shè)置不同樣本之間的權(quán) 重,選擇出對目標(biāo)任務(wù)有幫助的樣本,提高遷移學(xué)習(xí)的效果。TrAdaboost(見文 獻[2]Dai W,Yang Q,XueG R,et al.Boosting for transfer learning[C]//International Conference onMachine Learning.ACM,2007:193-200.即戴文淵,楊強,薛貴榮,俞 勇.遷移學(xué)習(xí)集成[C]//國際機器學(xué)習(xí)會議.ACM,2007:193-200.)方法利用迭代更新 權(quán)重的方法,通過對每次訓(xùn)練的模型在目標(biāo)領(lǐng)域上的分類效果,計算誤差,反饋 更新樣本的權(quán)重,得出最后的分類模型。另外一種方法是多源遷移的模型框架。 已有的多源遷移學(xué)習(xí)方法已經(jīng)很多,目前比較常用的遷移學(xué)習(xí)方法是根據(jù)不同領(lǐng) 域之間的特征分布的距離作為其衡量領(lǐng)域之間的相似性,進而對不同領(lǐng)域構(gòu)建的 基分類器進行加權(quán)。在使用遷移學(xué)習(xí)的方法來預(yù)測問答社區(qū)標(biāo)簽流行性發(fā)展趨勢 的預(yù)測問題中,根據(jù)特征分布之間的差異性來衡量不同領(lǐng)域之間的相似性大小, 不能取得較好的遷移提升效果。
發(fā)明內(nèi)容
為了解決跨社區(qū)標(biāo)簽流行性的預(yù)測問題,為了較好的衡量涉及網(wǎng)絡(luò)結(jié)構(gòu)的不 同領(lǐng)域之間的差異,和改善TrAdaboost在在具有負(fù)遷移數(shù)據(jù)源上的遷移效果的 魯棒性,本發(fā)明提出一種基于網(wǎng)絡(luò)結(jié)構(gòu)相似性的A-TrAdaboost算法來預(yù)測在線 問答社區(qū)中新標(biāo)簽在未來的流行性發(fā)展趨勢。
本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案如下:
一種基于A-TrAdaboost算法的多源社區(qū)標(biāo)簽發(fā)展趨勢預(yù)測方法,包括如下步 驟:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江工業(yè)大學(xué),未經(jīng)浙江工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810453513.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規(guī)劃、調(diào)度或分配時間、人員或機器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理
- 基于多源領(lǐng)域?qū)嵗w移的情感分類方法
- 一種遷移學(xué)習(xí)分類的方法及裝置
- 一種基于A-TrAdaboost算法的多源社區(qū)標(biāo)簽發(fā)展趨勢預(yù)測方法
- 一種基于粒子群優(yōu)化的TrAdaboost樣本遷移航空影像分類方法
- 一種基于YOLOv3與SSR的行人檢測算法
- 一種面向復(fù)雜電磁環(huán)境的雷達輻射源識別方法
- 一種基于跨域光譜信息的農(nóng)產(chǎn)品品質(zhì)無損檢測方法及可泛化系統(tǒng)
- 基于改進型TrAdaBoost的遷移學(xué)習(xí)室內(nèi)定位方法
- 基于同態(tài)加密的安全遷移學(xué)習(xí)系統(tǒng)
- 一種知識遷移方法、無線網(wǎng)絡(luò)設(shè)備個體識別方法及系統(tǒng)





