[發明專利]一種基于知識圖譜的影視擇優推薦系統和方法在審
| 申請號: | 201810435021.4 | 申請日: | 2018-05-09 |
| 公開(公告)號: | CN109241341A | 公開(公告)日: | 2019-01-18 |
| 發明(設計)人: | 彭俊杰;曾瑩;游錄金;陳杰;王瑛濤;陳淦 | 申請(專利權)人: | 上海大學 |
| 主分類號: | G06F16/73 | 分類號: | G06F16/73 |
| 代理公司: | 上海上大專利事務所(普通合伙) 31205 | 代理人: | 陸聰明 |
| 地址: | 200444*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 影視 推薦系統 算法 圖譜 個性化推薦 結果展示模塊 用戶信息采集 資源采集模塊 處理模塊 存儲模塊 模塊介紹 評價指標 權重因子 圖譜構建 影視內容 影響因素 真實數據 多維度 實時性 命中率 排片 影院 覆蓋率 投放 引入 應用 分析 | ||
1.一種基于知識圖譜的影視擇優推薦系統包括影視資源信息采集模塊(1)、影視知識圖譜構建模塊(2)、影視知識圖譜存儲模塊(3)、擇優推薦系統處理模塊(4)、用戶信息采集模塊(5)、結果展示模塊(6),其特征在于:所述影視資源信息采集模塊(1)經影視知識圖譜構建模塊(2)連接影視知識圖譜存儲模塊(3),一個擇優推薦系統處理模塊(4)連接所述影視知識圖譜存儲模塊(3),一個用戶信息采集模塊(5)和一個結果展示模塊(6);所述影視資源信息采集模塊(1)將從互聯網網頁上采集到的資源進行數據清洗傳輸到影視知識圖譜構建模塊(2),該模塊(2)利用已經處理完的數據進行相關處理獲得知識圖譜的元素,再利用存儲模塊(3)進行知識圖譜的存儲與表示,從而真正構建了一個知識圖譜;該知識圖譜隨時動態更新網上的相關影視資源信息,為精準推薦奠定基礎;用戶信息采集模塊(5)是用來采集用戶的搜索觀看記錄,然后將用戶的相關觀看信息傳入擇優推薦系統處理模塊(4),通過該模塊(4)的方法得到一個結果集并傳入到結果展示模塊(6),該模塊(6)將推薦的結果列表展示給用戶,讓用戶自行點擊。
2.一種基于知識圖譜的影視擇優推薦方法,采用根據權利要求所述的基于知識圖譜的影視擇優推薦系統進行操作,其特征在于操作步驟如下:
1)影視資源信息采集模塊(1)利用爬蟲技術從互聯網的各大影視網站上爬取相關的影視信息,進行非結構化文本信息的處理,數據的清洗過程包含對獲取到的數據源進行分詞,標注命名實體以及語料格式轉換;
2)影視知識圖譜構建模塊(2)利用影視資源信息采集模塊(1)數據清洗后得到的數據進行實體識別和實體關系抽取兩個功能,該模塊是基于人工規則和聚類算法混搭的技術,基于人工規則獲取到實體名稱,基于聚類算法獲取到實體關系模式;
3)影視知識圖譜存儲模塊(3)是將影視知識圖譜構建模塊(2)獲取到的實體和實體關系導入圖數據庫Neo4J中進行存儲和真正地建構展示,圖數據庫中的邊和點即代表知識圖譜的實體間關系和實體名稱;
4)以上模塊(1)、(2)、(3)是為了隨時更新知識圖譜的影視知識,為后續精準推送奠定了基礎;用戶信息采集模塊(5)是采用Json形式傳回后臺解析用戶的相關搜索觀看記錄,從中解析出用戶看的電影名稱、參演人名、導演、編劇等信息,并將這些信息傳輸給擇優推薦系統處理模塊(4);
5)擇優推薦系統處理模塊(4)根據用戶采集模塊(5)得到的信息,從知識圖譜中查詢出所有符合傳入實體名稱和實體關系的所有相關影視節目節點,并利用基于知識圖譜的擇優推薦進行處理得到結果集,并將結果集傳輸給推薦結果展示模塊(6);
6)推薦結果展示模塊(6)根據擇優推薦系統處理模塊(4)得到的數據從后臺以Json形式傳給前端解析并以列表形式展示給用戶,供用戶隨意選擇。
3.根據權利要求2所述的基于知識圖譜的影視擇優推薦方法其特征在于:所述步驟5)中根據得到的電影名稱、演員名稱、導演名稱、劇情標簽、編劇名稱等找到相對應的節點名稱和屬性,再通過關系找到相關聯的電影節點名稱,然后通過遍歷每部電影節點,獲得每部電影的相關影響該節點的因素內容節點,并獲得每個因素內容節點的相關屬性,通過屬性值檔級劃分、影響權重值確定來對因素內容節點的熱度值進行計算,然后再聯合每個影視節點的因素熱度值進行檔級劃分、影響權重值確定來影視節點播放評分的計算,最后根據播放評分值的大小擇優推薦用戶前TopN名的影視節目內容給用戶,主要包含以下幾個步驟:
5-1)用戶輸入的電影名稱,影視知識圖譜存儲模塊利用知識圖譜的強大關聯查詢能力搜索出該部電影的所有現有知識圖譜中相關相同的電影、演員、導演、編劇、劇情等的節點信息,同時判斷用戶搜索的電影是否含有同系列屬性電影這個屬性,如果有,放在推薦列表最前面;
5-2)再利用知識圖譜將5-1)中已經遍歷出的相關節點再一次遍歷,查詢到與這些相關節點相關的電影名稱節點;
5-3)將5-2)得到的電影名稱節點遍歷,得到每一部電影中的導演、演員、編劇、劇情等相關因素內容節點,然后得到這些節點的影響指標屬性值,例如人氣排行榜、用戶評分數、用戶瀏覽量、用戶評論數等屬性值,通過屬性值的等級判定得到每個影響指標的權重比值,再判斷是否有突出檔級,如果有,則在權重比值的基礎上增加相應地突出權重值,通過計算得到因素內容節點的熱度值;
5-4)判斷熱度值的等級得到每個因素內容節點的權重值,在判斷是否有突出檔級,如果有,則在權重比值的基礎上增加相應地突出權重值,再通過計算得到電影的播放評分值;
5-5)對5-4)計算出來的播放評分進行排序擇優推薦,取出前TopN名推薦給用戶觀看;如果播放評分低于某個值,也不進行推薦。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海大學,未經上海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810435021.4/1.html,轉載請聲明來源鉆瓜專利網。





