[發(fā)明專利]一種基于鄰域粗糙集的電影三支推薦方法有效
| 申請?zhí)枺?/td> | 202010631881.2 | 申請日: | 2020-07-03 |
| 公開(公告)號(hào): | CN111814046B | 公開(公告)日: | 2023-10-13 |
| 發(fā)明(設(shè)計(jì))人: | 吳成英;張清華;高滿;程云龍;趙凡;艾志華 | 申請(專利權(quán))人: | 重慶郵電大學(xué) |
| 主分類號(hào): | G06F16/9535 | 分類號(hào): | G06F16/9535 |
| 代理公司: | 重慶輝騰律師事務(wù)所 50215 | 代理人: | 王海軍 |
| 地址: | 400065 重*** | 國省代碼: | 重慶;50 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 鄰域 粗糙 電影 推薦 方法 | ||
本發(fā)明屬于計(jì)算機(jī)科學(xué)與技術(shù)領(lǐng)域,特別涉及一種基于鄰域粗糙集的電影三支推薦方法,包括獲取歷史數(shù)據(jù)并對數(shù)據(jù)進(jìn)行預(yù)處理;構(gòu)建用戶與用戶之間的相似性矩陣;以目標(biāo)用戶為中心構(gòu)建鄰域,且令鄰域內(nèi)的用戶都與鄰域中心的用戶相似,將鄰域中的用戶作為近鄰用戶;計(jì)算訓(xùn)練數(shù)據(jù)集的全局領(lǐng)域半徑和每個(gè)用戶的最優(yōu)鄰域半徑,若用戶最優(yōu)鄰域半徑大于全局鄰域半徑則用戶屬于正區(qū)域或負(fù)區(qū)域用戶,否則用戶為邊界區(qū)域用戶;根據(jù)邊界區(qū)域用戶隸屬目標(biāo)概念的隸屬度構(gòu)造陰影集,由陰影集模型得到推薦閾值;根據(jù)待推薦數(shù)據(jù)的隸屬度與推薦閾值的關(guān)系進(jìn)行三支推薦;本發(fā)明解決了傳統(tǒng)推薦方法根據(jù)預(yù)測評(píng)分實(shí)施推薦帶來了更多的不確定造成推薦質(zhì)量降低的問題。
技術(shù)領(lǐng)域
本發(fā)明屬于計(jì)算機(jī)科學(xué)與技術(shù)領(lǐng)域,特別涉及一種基于鄰域粗糙集的電影三支推薦方法。
背景技術(shù)
推薦系統(tǒng)(recommender systems)是利用信息過濾技術(shù)向用戶推薦其可能感興趣的信息。目前,為了解決信息超載,推薦系統(tǒng)已廣泛應(yīng)用于多個(gè)領(lǐng)域,如電子商務(wù),音樂,新聞等。由于推薦數(shù)據(jù)的稀疏性,傳統(tǒng)的推薦系統(tǒng)主要研究缺失數(shù)據(jù)的預(yù)測,然后根據(jù)預(yù)測數(shù)據(jù)向目標(biāo)用戶進(jìn)行推薦。但是,預(yù)測的過程中可能增加更多的不確定性,造成推薦性能降低。面對這一問題,如何通過原始數(shù)據(jù)完成推薦并盡可能的提高推薦精度是一個(gè)有價(jià)值的問題。
波蘭學(xué)者Pawlak于1982年提出的粗糙集理論是一種處理不完備性、不確定性問題的強(qiáng)有效的數(shù)學(xué)工具。近些年,粗糙集理論已被廣泛應(yīng)用于數(shù)據(jù)挖掘、決策支持、特征選擇等眾多研究領(lǐng)域。Pawlak粗糙集模型中最基本的概念是等價(jià)關(guān)系,它可直接由一系列的字符型特征誘導(dǎo)產(chǎn)生。然而,在真實(shí)世界中存在著大量的數(shù)值型特征,為了讓經(jīng)典的粗糙集方法更好地適應(yīng)現(xiàn)實(shí)應(yīng)用,天津大學(xué)胡清華教授等人借助3種不同的距離函數(shù)提出了鄰域粗糙集模型。在胡教授的鄰域粗糙集模型中,鄰域信息??捎勺址吞卣骱蛿?shù)值型特征共同誘導(dǎo)產(chǎn)生。
三支決策是近年發(fā)展起來的一種處理不確定性決策的粒計(jì)算方法,是Yao在長期研究粗糙集,特別是概率粗糙集和決策粗糙集過程中,總結(jié)和提煉出來的一種符合人類實(shí)際認(rèn)知能力的“三分而治”的決策模式。作為傳統(tǒng)二支決策理論的一種重要推廣,三支決策理論考慮到?jīng)Q策過程中存在的不確定性因素,將延遲決策作為信息不足以取代絕對接受或拒絕接收的第三種決策行為。三支決策的核心思想是將一個(gè)統(tǒng)一集劃分為三個(gè)互不相交的區(qū)域,對每一個(gè)區(qū)域來制定相應(yīng)的決策策略。
綜上所述,借助于三支和鄰域粗糙集構(gòu)造粒的思想,設(shè)計(jì)出了一種基于鄰域粗糙集的三支電影推薦模型。該模型直接利用原始數(shù)據(jù)找到目標(biāo)用戶的近鄰用戶,然后根據(jù)近鄰用戶的偏好完成推薦任務(wù)。另外,三支推薦對不確定的目標(biāo)用戶采取延遲推薦的決策,相比二支推薦推薦精度會(huì)更高。
發(fā)明內(nèi)容
為了解決傳統(tǒng)推薦方法根據(jù)預(yù)測評(píng)分實(shí)施推薦帶來了更多的不確定造成推薦質(zhì)量降低的問題,本發(fā)明提出一種基于鄰域粗糙集的電影三支推薦方法,具體包括以下步驟:
S1、從當(dāng)前電影資源庫中選取評(píng)分排名60%的電影作為待選集;
S2、獲取用戶對待選集中電影的評(píng)分?jǐn)?shù)據(jù),對評(píng)分?jǐn)?shù)據(jù)進(jìn)行歸一化處理;
S3、構(gòu)建用戶與用戶之間的相似性矩陣;
S4、以目標(biāo)用戶為中心構(gòu)建鄰域,且令鄰域內(nèi)的用戶都與鄰域中心的用戶相似,將鄰域中的用戶作為近鄰用戶;
S5、計(jì)算訓(xùn)練數(shù)據(jù)集的全局領(lǐng)域半徑和每個(gè)用戶的最優(yōu)鄰域半徑,若用戶最優(yōu)鄰域半徑大于全局鄰域半徑則用戶屬于正區(qū)域或負(fù)區(qū)域用戶,否則用戶為邊界區(qū)域用戶;如果訓(xùn)練集中的用戶喜歡該電影則被劃分到正域,否則被劃分到負(fù)域,推薦系統(tǒng)對落在正區(qū)域的用戶直接推薦目標(biāo)電影,落在負(fù)區(qū)域的用戶不推薦,落在邊界域的用戶有的喜歡該電影、有的不喜歡,需要通過步驟S6~S8構(gòu)建陰影集模型確定是否推薦;
S6、根據(jù)邊界區(qū)域用戶隸屬目標(biāo)概念的隸屬度構(gòu)造陰影集,由陰影集模型得到三支推薦的閾值;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于重慶郵電大學(xué),未經(jīng)重慶郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010631881.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種裝配式組合鋼橋
- 下一篇:一種有色金屬原料加工處理裝置





