[發(fā)明專利]一種基于平衡理論的商品分類方法在審
| 申請?zhí)枺?/td> | 202211472798.0 | 申請日: | 2022-11-18 |
| 公開(公告)號: | CN115965434A | 公開(公告)日: | 2023-04-14 |
| 發(fā)明(設(shè)計(jì))人: | 魏哲巍;雷潤林;王楨;李雅亮;丁博麟 | 申請(專利權(quán))人: | 中國人民大學(xué) |
| 主分類號: | G06Q30/0601 | 分類號: | G06Q30/0601;G06F18/241;G06N3/04;G06N3/08 |
| 代理公司: | 北京中創(chuàng)陽光知識產(chǎn)權(quán)代理有限責(zé)任公司 11003 | 代理人: | 尹振啟 |
| 地址: | 100872 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 平衡理論 商品 分類 方法 | ||
1.一種基于平衡理論的商品分類方法,其特征在于:通過8個步驟實(shí)現(xiàn)對于商品的分類:
步驟S1,從購物網(wǎng)站中收集商品與用戶的信息,編號加入數(shù)據(jù)庫,所述商品與用戶的信息包括:商品的出產(chǎn)地、生產(chǎn)日期、價格等屬性等,用戶的年齡、累積消費(fèi)金額,在商品分類任務(wù)中將商品與用戶均視為網(wǎng)絡(luò)中的結(jié)點(diǎn),通過收集用戶購買商品的行為,建立用戶-商品網(wǎng)絡(luò);
具體的圖構(gòu)建方法為:根據(jù)商品與用戶信息,將目標(biāo)場景中的對象及對象關(guān)系使用圖數(shù)據(jù)結(jié)構(gòu)進(jìn)行建模,表示為圖G,其中,對象為G中的結(jié)點(diǎn),所述對象之間的關(guān)系為圖G中的邊,可以使用鄰接矩陣A表示,結(jié)點(diǎn)對象附帶有結(jié)點(diǎn)特征與結(jié)點(diǎn)標(biāo)簽,分別記為X與y,若用戶購買過商品,則將用戶結(jié)點(diǎn)與商品結(jié)點(diǎn)之間連邊,商品的細(xì)分類別標(biāo)簽即為結(jié)點(diǎn)標(biāo)簽;之后將已知細(xì)分類別標(biāo)簽的商品被劃入訓(xùn)練集,訓(xùn)練集結(jié)點(diǎn)中將有小部分結(jié)點(diǎn)被劃入驗(yàn)證集,用于選擇訓(xùn)練模型,待預(yù)測細(xì)分類別的未知商品為測試集結(jié)點(diǎn),在模型訓(xùn)練中,使用訓(xùn)練集結(jié)點(diǎn)進(jìn)行模型訓(xùn)練,利用測試集結(jié)點(diǎn)的特征以及它們與其它結(jié)點(diǎn)的連接關(guān)系進(jìn)行標(biāo)簽預(yù)測;
步驟S2,在圖結(jié)構(gòu)G中,首先使用特征變換模塊進(jìn)行結(jié)點(diǎn)特征預(yù)處理,特征變換模塊可以選擇多層感知機(jī)算法或其它特征預(yù)處理算法進(jìn)行特征預(yù)處理。所述多層感知機(jī)算法對原始特征X進(jìn)行特征變換,變換后特征記為T0,若X擁有d維特征,使用特征變換模塊將其降維。如使用多層感知機(jī)通過兩層線性層與激活層將結(jié)點(diǎn)特征降至h維,其中h為預(yù)處理后的特征維度,預(yù)處理后特征維度通常小于原始特征維度,起到特征降維與高度凝練結(jié)點(diǎn)表示的作用;使用ReLU作為激活函數(shù),具體形式為:T0=W2(ReLU(W1X)),預(yù)處理后的特征可以被存儲于數(shù)據(jù)庫中,在特征傳播階段再取出用于學(xué)習(xí);
步驟S3,將待學(xué)習(xí)的特征從數(shù)據(jù)庫中的取出。對變換后的特征矩陣進(jìn)行消息傳播,其中分為兩個子步驟:
步驟S31,記D為對角度矩陣,對角度矩陣為對角矩陣,其對角線元素為對應(yīng)結(jié)點(diǎn)的度,使用對角度矩陣與鄰接矩陣計(jì)算歸一化的鄰接矩陣A'=D-1/2AD-1/2;
步驟S32,拉普拉斯矩陣定義為度矩陣減鄰接矩陣,記L=D-A為拉普拉斯矩陣,記L’=I-A'為歸一化的拉普拉斯矩陣,利用(I-L‘)2作為單次傳播矩陣,建立譜域上對稱的圖濾波器;
步驟S33,以結(jié)點(diǎn)為單位使用對稱圖濾波器,進(jìn)行圖信號傳播,得到傳播后特征矩陣T2,對每個結(jié)點(diǎn)vi而言,其變換后特征即為矩陣T2=(I-L’)2X的第i行;
步驟S4,設(shè)置傳播次數(shù)上限為K。重復(fù)K次步驟S3,對特征傳播矩陣Ti傳播得到特征矩陣Ti+2,匯總所有特征傳播矩陣,得到偶次階特征傳播矩陣序列{T0,T2,…,T2K};實(shí)際計(jì)算中通過先計(jì)算一階傳播(I-L‘)X,再繼續(xù)計(jì)算第二次傳播(I-L)((I-L)X)的方式降低算法空間代價;
步驟S5,定義對傳播后特征矩陣序列的可學(xué)習(xí)系數(shù)alist={a0,a1,…,aK},定義偶次特征傳播序列定義偶次對稱圖濾波器進(jìn)行圖濾波,得到z=g(L')X通過加權(quán)求和,計(jì)算濾波后的特征矩陣初始化Tall=0,之后每得到一個傳播特征矩陣Ti,便將Ti累加至Tall;
步驟S6中,定義交叉熵?fù)p失函數(shù)計(jì)算Tall與y的損失,基于該損失使用反向傳播算法優(yōu)化多層感知機(jī)以及可學(xué)習(xí)的加權(quán)參數(shù),使用Adam優(yōu)化器,定義優(yōu)化器的學(xué)習(xí)率與L2正則項(xiàng)為超參數(shù),對于每一輪迭代,獲取該輪迭代中可學(xué)習(xí)參數(shù)對損失的梯度,依據(jù)Adam算法中基于學(xué)習(xí)率以及歷史更新動量的方法確定搜索步長,根據(jù)歷史更新梯度方向與本輪梯度方向確定此次更新的方向,之后沿更新方向?qū)?shù)更新搜索步長個單位,在損失函數(shù)中加入基于L2正則項(xiàng)的參數(shù)懲罰項(xiàng),以減緩模型過擬合問題,在超參數(shù)選擇中,基于驗(yàn)證集選擇超參數(shù),在模型訓(xùn)練過程中,從訓(xùn)練集中劃分出部分結(jié)點(diǎn)作為驗(yàn)證集,在所有迭代輪次中選擇在驗(yàn)證集上表現(xiàn)最好的模型對應(yīng)的超參數(shù)作為最終的模型超參數(shù);
步驟S7中,重復(fù)步驟S2至S6,直至算法在一定迭代步數(shù)內(nèi)對驗(yàn)證集上的分類結(jié)果沒有性能提升,則停止模型參數(shù)更新;將步驟S6中篩選出的最佳模型應(yīng)用至各個商品結(jié)點(diǎn),將得到結(jié)點(diǎn)的低維特征表示存入數(shù)據(jù)庫中,作為最終的結(jié)點(diǎn)表示;
步驟S8中,輸入數(shù)據(jù)庫中的最終結(jié)點(diǎn)分類表示,使用指數(shù)歸一化打分函數(shù),為待預(yù)測的商品打分,預(yù)測其細(xì)分類別,得到商品屬于各個細(xì)分類別的概率,具體地,使用步驟S7中輸出的向量,返回向量中的最大值對應(yīng)的商品類別。
2.如權(quán)利要求1所述的一種基于平衡理論的商品分類方法,其特征在于:所述傳播后特征矩陣序列的系數(shù)進(jìn)行初始化使用超參數(shù)α,初始化后的矩陣序列系數(shù)為:ai=α(1-α)2i。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國人民大學(xué),未經(jīng)中國人民大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211472798.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q30-00 商業(yè),例如購物或電子商務(wù)
G06Q30-02 .行銷,例如,市場研究與分析、調(diào)查、促銷、廣告、買方剖析研究、客戶管理或獎勵;價格評估或確定
G06Q30-04 .簽單或開發(fā)票
G06Q30-06 .購買、出售或租賃交易
G06Q30-08 ..拍賣
- 畜禽用微生態(tài)調(diào)節(jié)劑
- 履帶行走機(jī)構(gòu)內(nèi)阻力和功耗分析計(jì)算方法
- 一種履帶行走機(jī)構(gòu)內(nèi)阻力和功耗分析計(jì)算方法
- 一種用于評估衛(wèi)星深層充電的風(fēng)險的方法
- 一種有約束條件的林地規(guī)劃模型
- 一種基于結(jié)構(gòu)平衡理論的復(fù)雜網(wǎng)絡(luò)圖像識別方法
- 一種基于團(tuán)簇屬性和平衡理論在符號網(wǎng)絡(luò)中挖掘內(nèi)聚子圖的方法
- 邊符號預(yù)測方法、裝置及設(shè)備
- 一種高焓激波風(fēng)洞總溫測量方法
- 一種基于平衡飛行理論的運(yùn)載火箭軌道高度保持控制方法





