[發明專利]基于標簽遷移的跨域推薦方法有效
| 申請號: | 202010462560.4 | 申請日: | 2020-05-27 |
| 公開(公告)號: | CN111708937B | 公開(公告)日: | 2022-12-16 |
| 發明(設計)人: | 姚全珠;呂鵬;費蓉;陳晨 | 申請(專利權)人: | 北京閱視無限科技有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/9536;G06F16/906;G06N3/04 |
| 代理公司: | 深圳峰誠志合知識產權代理有限公司 44525 | 代理人: | 趙愛婷 |
| 地址: | 100000 北京市石景*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 標簽 遷移 推薦 方法 | ||
本發明公開了一種基于標簽遷移的跨域推薦方法,首先假設A領域為源領域,B領域為目標領域,A領域與B領域存在重疊的用戶,用戶共用一套相同的標簽系統并且A領域和B領域中都有對應的用戶物品評分信息,通過遷移上述共享的標簽信息,實現以A領域為源領域輔助目標領域B領域完成推薦任務,或者以B領域為源領域輔助目標領域A領域完成推薦任務;利用用戶對A領域的評分信息構建A領域用戶評分矩陣;然后對A領域用戶評分矩陣進行分解,得到用戶潛在特征矩陣和物品潛在特征矩陣,進而得到每一類別下的用戶;最后對每一類下的用戶進行跨域推薦。本發明解決了現有跨域推薦方法中存在的僅利用評分信息或標簽信息進行推薦的局限性。
技術領域
本發明屬于數據挖掘技術領域,具體涉及一種基于標簽遷移的跨域推薦方法。
背景技術
身處大數據時代,互聯網用戶每天都在生產數據、創造數據和使用數據,一方面,數據量與日俱增,信息過載問題嚴重,另一方面,用戶面對大量的信息不能及時有效地去尋找到自己所需的信息,為了解決這些問題,推薦系統應運而生,并在各個領域中得到了廣泛的應用,但是傳統的推薦主要還是集中在單一領域中,隨著互聯網技術的高速發展,急劇增多的用戶和物品數量使得傳統單一的推薦系統面臨數據稀疏和冷啟動問題的嚴峻挑戰。
目前,基于遷移學習技術,結合推薦算法,出現了跨領域推薦的方法,旨在緩解傳統單一領域推薦中存在的稀疏性問題和新用戶新物品的冷啟動問題,比如抹平不同領域間的評分刻度差異,直接遷移評分矩陣的方法,還有基于領域間標簽的遷移學習方法,但是這些方法存在很多的不足,如果忽略領域間的評分刻度差異,可能會發生負遷移的現象,而只利用領域間的標簽信息,忽略評分信息,可能會削弱最終的推薦效果。
發明內容
本發明的目的是提供一種基于標簽遷移的跨域推薦方法,解決了現有跨域推薦方法中存在的僅利用評分信息或標簽信息進行推薦的局限性。
本發明所采用的技術方案是,基于標簽遷移的跨域推薦方法,具體按照以下步驟實施:
步驟1、假設A領域為源領域,B領域為目標領域,實現A領域與B領域之間的跨域推薦的前提條件如下:A領域與B領域存在重疊的用戶,所述用戶共用一套相同的標簽系統并且A領域和B領域中都有對應的用戶物品評分信息,通過遷移上述共享的標簽信息,實現以A領域為源領域輔助目標領域B領域完成推薦任務,或者以B領域為源領域輔助目標領域A領域完成推薦任務;
步驟2、利用用戶對A領域的評分信息構建A領域用戶評分矩陣;
步驟3、對A領域用戶評分矩陣進行分解,得到用戶潛在特征矩陣Usrc和物品潛在特征矩陣Vsrc;
步驟4、基于用戶潛在特征矩陣對用戶進行聚類,聚類采用K-Means聚類方法,得到每一類別下的用戶;
步驟5、構建神經網絡模型,對步驟4得到的不同類型下的用戶使用的標簽進行學習,并訓練神經網絡,得到能根據用戶使用標簽的特征對用戶進行分類的神經網絡模型,經過不斷地訓練得到最優網絡模型;
步驟6、對每一類下的用戶進行跨域推薦。
本發明的特點還在于,
步驟1中A領域與B領域重疊的用戶共用一套相同的標簽,標簽包括屬性標簽和行為標簽,其中屬性標簽包括性別、年齡、職業,行為標簽包括用戶對物品所屬標簽的使用次數。
步驟2具體如下:
步驟2.1、利用Pandas庫中的read_table函數讀入用戶物品評分表,該表中包括的字段有用戶ID、物品ID和評分,該函數指定要打開文件的位置、用作列名的行號、用作行索引的列編號或列名,并設置python引擎來對用戶物品評分表進行解析;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京閱視無限科技有限公司,未經北京閱視無限科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010462560.4/2.html,轉載請聲明來源鉆瓜專利網。





