[發(fā)明專利]一種基于平衡理論的商品分類方法在審
| 申請?zhí)枺?/td> | 202211472798.0 | 申請日: | 2022-11-18 |
| 公開(公告)號: | CN115965434A | 公開(公告)日: | 2023-04-14 |
| 發(fā)明(設計)人: | 魏哲巍;雷潤林;王楨;李雅亮;丁博麟 | 申請(專利權(quán))人: | 中國人民大學 |
| 主分類號: | G06Q30/0601 | 分類號: | G06Q30/0601;G06F18/241;G06N3/04;G06N3/08 |
| 代理公司: | 北京中創(chuàng)陽光知識產(chǎn)權(quán)代理有限責任公司 11003 | 代理人: | 尹振啟 |
| 地址: | 100872 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 平衡理論 商品 分類 方法 | ||
本發(fā)明通過網(wǎng)絡安全領(lǐng)域的方法,實現(xiàn)了一種基于平衡理論的商品分類方法。通過8個步驟實現(xiàn)對于商品的分類:步驟S1,將目標場景中的對象及對象關(guān)系使用圖數(shù)據(jù)結(jié)構(gòu)進行建模;步驟S2,將結(jié)點特征降至h維;步驟S3,對變換后的特征矩陣進行消息傳播;步驟S4,重復步驟S3;步驟S5,定義對傳播后特征矩陣序列的可學習系數(shù)加權(quán)求和;步驟S6中,定義交叉熵損失函數(shù)、優(yōu)化器的學習率與L2正則項為超參數(shù)、選擇超參數(shù);步驟S7中,重復步驟S2至S6。步驟S8中,根據(jù)S7結(jié)果返回商品預測類別。本發(fā)明提供的方法相比一般的圖魯棒性方法,本發(fā)明技術(shù)在譜域角度具備更好的理論解釋性。
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能技術(shù)領(lǐng)域,尤其涉及一種基于平衡理論的商品分類方法。
背景技術(shù)
隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)量急劇增長,數(shù)據(jù)類型更加多元。既存在圖像,文本等結(jié)構(gòu)化數(shù)據(jù),也存在非結(jié)構(gòu)化的圖數(shù)據(jù),如社交網(wǎng)絡,生物蛋白質(zhì)分子結(jié)構(gòu)等。為了解決圖數(shù)據(jù)上的表示學習問題,圖神經(jīng)網(wǎng)絡技術(shù)被提出,并在圖結(jié)點分類、圖分類等任務上取得優(yōu)異表現(xiàn)。在實際應用中,圖神經(jīng)網(wǎng)絡被廣泛應用于生物分子性質(zhì)預測、社交網(wǎng)絡數(shù)據(jù)挖掘、欺詐識別、推薦系統(tǒng)設計當中,也可見于物理、化學系統(tǒng)的真實建模。
一種基于圖神經(jīng)網(wǎng)絡的欺詐識別方法,將用戶建立為結(jié)點,將用戶關(guān)系、業(yè)戶關(guān)系等等使用圖結(jié)構(gòu)建模。之后基于圖同配性假設,使用相關(guān)的圖神經(jīng)網(wǎng)絡學習出各個結(jié)點的抽象表示,將與正常用戶表示相異的結(jié)點識別為欺詐/異常結(jié)點。圖神經(jīng)網(wǎng)絡可以有效利用結(jié)點間的交互關(guān)系,在處理圖數(shù)據(jù)相關(guān)問題時效果顯著。
圖同配性意為:在圖結(jié)構(gòu)中相連的結(jié)點擁有較為相似的特征與標簽。圖同配性常作為設計圖神經(jīng)網(wǎng)絡的先決條件。然而在真實網(wǎng)絡中,圖同配性并非一直能被滿足。以商品分類網(wǎng)絡為例,用戶與商品之間的關(guān)系有喜好、有厭惡,他們都能反映商品與用戶間的有效交互關(guān)系,但二者的表現(xiàn)形式存在差異,并非都已同配的形式表現(xiàn)。早期的圖神經(jīng)網(wǎng)絡往往在譜域上對應于低通濾波器,將圖結(jié)點特征在相鄰結(jié)點之間平滑。此類圖神經(jīng)網(wǎng)絡在面對異配圖時表現(xiàn)較差。一個更困難的問題是:探索能否存在一種更魯棒的圖結(jié)構(gòu)信息提取器,使得兩方面的圖結(jié)構(gòu)信息能被同一個模型有效利用。到目前為止,還不存在圖神經(jīng)網(wǎng)絡具備該種能力。
另外,傳統(tǒng)的圖神經(jīng)網(wǎng)絡易受到圖結(jié)構(gòu)攻擊的影響。若圖結(jié)構(gòu)發(fā)生變化,圖神經(jīng)網(wǎng)絡的性能可能面臨大幅下降,表現(xiàn)為面對結(jié)構(gòu)攻擊的脆弱性。圖攻擊可以按攻擊方式被分為圖結(jié)構(gòu)攻擊、圖特征攻擊或二者兼有。對圖結(jié)構(gòu)攻擊而言,按攻擊時間可以分為針對全圖進行的攻擊或是僅針對測試集進行的攻擊。按照攻擊者對被攻擊模型的了解程度,可以分為黑盒攻擊、白盒攻擊與灰盒攻擊。在真實應用場景中,高質(zhì)量的圖結(jié)構(gòu)未必能一直得到保證。以消費者網(wǎng)絡為例,大量不活躍、刷單的用戶結(jié)點與一般用戶建立不正常關(guān)系連接,或是正常用戶賬號失竊,正常的用戶關(guān)系遭到修改,這些都對圖結(jié)構(gòu)質(zhì)量與圖神經(jīng)網(wǎng)絡的魯棒性提出考驗。在商品用戶分類問題中,存在大量的異常結(jié)點、不活躍結(jié)點以及錯亂的圖結(jié)構(gòu)。若圖神經(jīng)網(wǎng)絡不包含應對這種問題的魯棒性設計,則圖神經(jīng)網(wǎng)絡的性能將遭遇嚴重下滑,難以再表現(xiàn)出優(yōu)異的圖學習能力。另外,在商品分類任務中,用戶的“喜愛”與“厭惡”關(guān)系均能反應用戶對商品的偏好,而現(xiàn)有的算法通常不具備在這兩種關(guān)系上的直接泛化能力,表現(xiàn)為對同配性關(guān)系的依賴。
現(xiàn)有的魯棒圖神經(jīng)網(wǎng)絡多定義在空域上,算法相對復雜,時間與空間代價較高,難以在大圖上取得較好的發(fā)揮。在真實的商品用戶分類網(wǎng)絡中,結(jié)點與邊的數(shù)量往往以億為單位量級,過于復雜的魯棒性圖神經(jīng)網(wǎng)絡設計難以被應用。以ProGNN方法為例,其需要與圖結(jié)點個數(shù)的平方級別的空間代價,難以擴展到擁有十萬及以上量級的任務中。譜域方法的擴展性良好,但目前基于譜域方法的魯棒圖神經(jīng)網(wǎng)絡較少,且當訓練圖與測試圖存在較大的圖同配性差異時,目前的譜域方法缺乏魯棒性保障。如何針對以上場景設計對應的譜域圖神經(jīng)網(wǎng)絡是一個難題。
針對上述問題存在如下現(xiàn)有技術(shù):
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國人民大學,未經(jīng)中國人民大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211472798.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





