[發(fā)明專利]用于用戶聚類的方法、電子設(shè)備和存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202111072920.0 | 申請日: | 2021-09-14 |
| 公開(公告)號: | CN113792784B | 公開(公告)日: | 2022-06-21 |
| 發(fā)明(設(shè)計)人: | 顧茂杰;彭飛;唐文斌 | 申請(專利權(quán))人: | 上海任意門科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F16/901;G06F16/906;G06Q50/00 |
| 代理公司: | 北京市金杜律師事務(wù)所 11256 | 代理人: | 陳振 |
| 地址: | 201207 上海市浦東新*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 用戶 方法 電子設(shè)備 存儲 介質(zhì) | ||
本公開的實施例涉及用于用戶聚類的方法、電子設(shè)備和計算機存儲介質(zhì),涉及信息處理領(lǐng)域。根據(jù)該方法,獲取與多個用戶相關(guān)聯(lián)的多個用戶標識和多項用戶屬性信息以及指示所述多個用戶之間的多種社交行為的行為信息;基于多個用戶標識、多項用戶屬性信息和行為信息,生成有向圖;基于有向圖,訓(xùn)練圖自編碼器模型,以生成與多個用戶相關(guān)聯(lián)的多個嵌入特征表示;以及基于多個嵌入特征表示,經(jīng)由聚類模型,生成多個用戶的聚類結(jié)果。由此,能夠基于用戶間社交行為生成有向圖來訓(xùn)練圖自編碼器模型,更準確地生成用戶嵌入特征表示從而更好地聚類。
技術(shù)領(lǐng)域
本公開的實施例總體涉及信息處理領(lǐng)域,具體涉及用于用戶聚類的方法、電子設(shè)備和計算機存儲介質(zhì)。
背景技術(shù)
隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,往往需要對類似的用戶進行聚類,以便對聚類的用戶進行近似內(nèi)容推薦。但是傳統(tǒng)方案往往構(gòu)建用戶之間的無向圖,并在無向圖的基礎(chǔ)上進行聚類,使得聚類結(jié)果不夠準確。
發(fā)明內(nèi)容
提供了一種用于用戶聚類的方法、電子設(shè)備以及計算機存儲介質(zhì),能夠基于用戶間社交行為生成有向圖來訓(xùn)練圖自編碼器模型,更準確地生成用戶嵌入特征表示從而更好地聚類。
根據(jù)本公開的第一方面,提供了一種用于用戶聚類的方法。該方法包括:獲取與多個用戶相關(guān)聯(lián)的多個用戶標識和多項用戶屬性信息以及指示多個用戶之間的多種社交行為的行為信息;基于多個用戶標識、多項用戶屬性信息和行為信息,生成有向圖,有向圖中的多個節(jié)點表示多個用戶,有向圖中任意第一節(jié)點到任意第二節(jié)點之間的至少一條有向邊表示第一節(jié)點表示的用戶對第二節(jié)點表示的用戶存在多種社交行為中的至少一種社交行為;基于有向圖,訓(xùn)練圖自編碼器模型,以生成與多個用戶相關(guān)聯(lián)的多個嵌入特征表示;以及基于多個嵌入特征表示,經(jīng)由聚類模型,生成多個用戶的聚類結(jié)果。
根據(jù)本公開的第二方面,提供了一種電子設(shè)備。該電子設(shè)備包括:至少一個處理器,以及與至少一個處理器通信連接的存儲器,其中,存儲器存儲有可被至少一個處理器執(zhí)行的指令,指令被至少一個處理器執(zhí)行,以使至少一個處理器能夠執(zhí)行根據(jù)第一方面所述的方法。
在本公開的第三方面中,提供了一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,該程序被處理器執(zhí)行時實現(xiàn)根據(jù)本公開的第一方面的方法。
應(yīng)當理解,本部分所描述的內(nèi)容并非旨在標識本公開的實施例的關(guān)鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
附圖說明
結(jié)合附圖并參考以下詳細說明,本公開各實施例的上述和其他特征、優(yōu)點及方面將變得更加明顯。在附圖中,相同或相似的附圖標注表示相同或相似的元素。
圖1是根據(jù)本公開的實施例的信息處理環(huán)境100的示意圖。
圖2是根據(jù)本公開的實施例的用于用戶聚類的方法200的示意圖。
圖3是根據(jù)本公開的實施例的用于訓(xùn)練圖自編碼器模型的方法300的示意圖。
圖4是根據(jù)本公開的實施例的用于生成與多個節(jié)點相關(guān)聯(lián)的多個嵌入特征表示的方法400的示意圖。
圖5是根據(jù)本公開的實施例的圖自編碼器模型500的示意圖。
圖6是用來實現(xiàn)本公開實施例的用于用戶聚類的方法的電子設(shè)備的框圖。
具體實施方式
以下結(jié)合附圖對本公開的示范性實施例做出說明,其中包括本公開實施例的各種細節(jié)以助于理解,應(yīng)當將它們認為僅僅是示范性的。因此,本領(lǐng)域普通技術(shù)人員應(yīng)當認識到,可以對這里描述的實施例做出各種改變和修改,而不會背離本公開的范圍和精神。同樣,為了清楚和簡明,以下的描述中省略了對公知功能和結(jié)構(gòu)的描述。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海任意門科技有限公司,未經(jīng)上海任意門科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111072920.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





