[發(fā)明專(zhuān)利]一種基于FastGCN推薦的樣本特征聚合方法在審
| 申請(qǐng)?zhí)枺?/td> | 202110358604.3 | 申請(qǐng)日: | 2021-04-02 |
| 公開(kāi)(公告)號(hào): | CN112948452A | 公開(kāi)(公告)日: | 2021-06-11 |
| 發(fā)明(設(shè)計(jì))人: | 董立巖;王浩;馬心陶;劉元寧;朱曉冬 | 申請(qǐng)(專(zhuān)利權(quán))人: | 吉林大學(xué) |
| 主分類(lèi)號(hào): | G06F16/2457 | 分類(lèi)號(hào): | G06F16/2457;G06K9/62;G06N3/04 |
| 代理公司: | 長(zhǎng)春市恒譽(yù)專(zhuān)利代理事務(wù)所(普通合伙) 22212 | 代理人: | 鞠傳龍 |
| 地址: | 130012 吉*** | 國(guó)省代碼: | 吉林;22 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 fastgcn 推薦 樣本 特征 聚合 方法 | ||
本發(fā)明公開(kāi)了一種基于FastGCN推薦的樣本特征聚合方法,其方法為:步驟一、首先確定當(dāng)前網(wǎng)絡(luò)中的所有結(jié)點(diǎn)對(duì)象;步驟二、獲得特征矩陣的高階度矩陣;步驟三、將得到的高階度矩陣聚合為一個(gè)最終形式的度矩陣;步驟四、使用處理后的特征樣本進(jìn)行FastGCN網(wǎng)絡(luò)推薦,并獲得質(zhì)量更高的推薦內(nèi)容,提升公司的數(shù)據(jù)服務(wù)業(yè)務(wù)的高效率運(yùn)作。本發(fā)明的有益效果:使用了一種局部特征融合的技術(shù)手段完成了對(duì)FastGCN模型樣本屬性特征的融合。經(jīng)過(guò)融合后的樣本對(duì)象將會(huì)有更豐富的屬性特征,神經(jīng)網(wǎng)絡(luò)對(duì)這些對(duì)象進(jìn)行特征映射時(shí)將會(huì)更容易地區(qū)分出它們所屬的類(lèi)別,從而實(shí)現(xiàn)提高模型的推薦精度。增加應(yīng)用體驗(yàn)。
技術(shù)領(lǐng)域
本發(fā)明涉及一種樣本特征聚合方法,特別涉及一種基于FastGCN推薦的樣本特征聚合方法。
背景技術(shù)
目前,基于FastGCN的推薦系統(tǒng)模型的應(yīng)用范圍在逐漸的擴(kuò)大,該模型在GCN的基礎(chǔ)上加快了它的推薦速度。但是它在對(duì)原始數(shù)據(jù)的特征量化時(shí),只采集了圖譜(下文中稱(chēng)為圖或者網(wǎng)絡(luò))中的顯式信息部分,而忽略了這些數(shù)據(jù)中的隱式信息。比如,在一個(gè)百科索引網(wǎng)絡(luò)中,有一項(xiàng)詞條為詞典,該詞條將會(huì)把與詞典某些特征相關(guān)或者相似的工具書(shū)列為它的擴(kuò)展閱讀。但是在FastGCN模型的樣本數(shù)據(jù)中,像詞典這樣的對(duì)象卻缺少與之相關(guān)的其它對(duì)象的特征。然而實(shí)際上它們?cè)谀承┨卣魃虾芸赡苁窍嗨频?,只不過(guò)當(dāng)前對(duì)象在該特征中的表現(xiàn)較弱。這說(shuō)明了該模型存在數(shù)據(jù)處理方面的技術(shù)缺陷,該缺陷使得該模型在實(shí)際的使用中將會(huì)降低用戶的應(yīng)用體驗(yàn)。并且也不利于公司的大數(shù)據(jù)業(yè)務(wù)的良性運(yùn)作。
發(fā)明內(nèi)容
本發(fā)明的目的是為了解決FastGCN模型在數(shù)據(jù)處理方面所存在的技術(shù)缺陷,而提供的一種基于FastGCN推薦的樣本特征聚合方法。
本發(fā)明提供的基于FastGCN推薦的樣本特征聚合方法,其方法包括如下步驟:
步驟一、首先確定當(dāng)前網(wǎng)絡(luò)中的所有結(jié)點(diǎn)對(duì)象,然后確定網(wǎng)絡(luò)中的所有對(duì)象屬性的個(gè)數(shù),將這些數(shù)據(jù)整理為列表形式,也就是哪些對(duì)象具有哪種屬性,并測(cè)量出每個(gè)對(duì)象與屬性的關(guān)系強(qiáng)度,通常取值0到1之間,將該列表轉(zhuǎn)化為特征矩陣的數(shù)據(jù)形式;
步驟二、獲得特征矩陣的高階度矩陣,特征矩陣中的每行進(jìn)行度數(shù)加權(quán)時(shí),需要增加上其鄰接對(duì)象的特征;
步驟三、將得到的高階度矩陣以C=C1+α*C2的形式將它們聚合為一個(gè)最終形式的度矩陣,然后用該矩陣求出度數(shù)加權(quán)特征矩陣,它的計(jì)算表示為:F=C-1F,最后將得到的F矩陣進(jìn)行歸一化處理既可作為FastGCN的輸入;
在上述的計(jì)算中,首先要通過(guò)統(tǒng)計(jì)的方法得到合適的參數(shù)α,并且它會(huì)存在一個(gè)能夠優(yōu)化模型表現(xiàn)的取值區(qū)間,除此之外,具有某些特點(diǎn)的應(yīng)用領(lǐng)域它們的參數(shù)的取值比較近似,因此特征聚合方案如果長(zhǎng)期應(yīng)用在同一個(gè)領(lǐng)域中可以將它的值進(jìn)行固定;
統(tǒng)計(jì)開(kāi)始前,設(shè)置它的起始值為0,然后在以一定的間隔增大它的值,在這個(gè)過(guò)程如果發(fā)現(xiàn),模型的變現(xiàn)沒(méi)有相應(yīng)的變化,可考慮加大跳躍間隔;而模型的推薦精度如果出現(xiàn)較大幅度的上升或者下降,那么考慮減少跳躍間隔或者是在一個(gè)更小的區(qū)間中進(jìn)行統(tǒng)計(jì),直到統(tǒng)計(jì)結(jié)果出現(xiàn)一個(gè)上升的幅度,繼續(xù)增大協(xié)調(diào)參數(shù)的值,當(dāng)模型的表現(xiàn)趨于平穩(wěn)的時(shí)候可以結(jié)束統(tǒng)計(jì),并且將對(duì)模型優(yōu)化最好的參數(shù)設(shè)為固定值;
當(dāng)該模型所處的領(lǐng)域隨著時(shí)間的流逝,網(wǎng)絡(luò)結(jié)構(gòu)以及屬性特征發(fā)生變化的時(shí)候,應(yīng)當(dāng)考慮重新統(tǒng)計(jì)最優(yōu)參數(shù);
步驟四、使用處理后的特征樣本進(jìn)行FastGCN網(wǎng)絡(luò)推薦,并獲得質(zhì)量更高的推薦內(nèi)容,提升公司的數(shù)據(jù)服務(wù)業(yè)務(wù)的高效率運(yùn)作。
本發(fā)明的有益效果:
本發(fā)明提供的基于FastGCN推薦的樣本特征聚合方法使用了一種局部特征融合的技術(shù)手段完成了對(duì)FastGCN模型樣本屬性特征的融合。經(jīng)過(guò)融合后的樣本對(duì)象將會(huì)有更豐富的屬性特征,神經(jīng)網(wǎng)絡(luò)對(duì)這些對(duì)象進(jìn)行特征映射時(shí)將會(huì)更容易地區(qū)分出它們所屬的類(lèi)別,從而實(shí)現(xiàn)提高模型的推薦精度。增加應(yīng)用體驗(yàn)。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于吉林大學(xué),未經(jīng)吉林大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110358604.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 樣本引入裝置、樣本引入基片和樣本引入方法
- 樣本查找方法、裝置及系統(tǒng)
- 模型訓(xùn)練、樣本平衡方法及裝置以及個(gè)人信用評(píng)分系統(tǒng)
- 樣本輸送系統(tǒng)、樣本輸送方法以及樣本檢測(cè)系統(tǒng)
- 樣本分析裝置、樣本檢測(cè)設(shè)備及樣本檢測(cè)方法
- 樣本檢測(cè)方法、樣本檢測(cè)裝置及樣本檢測(cè)系統(tǒng)
- 樣本架、樣本混勻系統(tǒng)及樣本分析儀
- 樣本收集管及樣本收集系統(tǒng)
- 樣本數(shù)據(jù)集的擴(kuò)容方法及模型的訓(xùn)練方法
- 行人重識(shí)別的噪聲樣本識(shí)別方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)





