[發(fā)明專利]一種基于特征相似性度量的三階段組合黨建視頻推薦方法有效
| 申請(qǐng)?zhí)枺?/td> | 201711266644.5 | 申請(qǐng)日: | 2017-12-05 |
| 公開(kāi)(公告)號(hào): | CN107818183B | 公開(kāi)(公告)日: | 2021-07-13 |
| 發(fā)明(設(shè)計(jì))人: | 曹子成;王順?lè)?/a>;李維華;阮小利;何敏 | 申請(qǐng)(專利權(quán))人: | 云南大學(xué) |
| 主分類號(hào): | G06F16/735 | 分類號(hào): | G06F16/735 |
| 代理公司: | 云南凌云律師事務(wù)所 53207 | 代理人: | 董建國(guó) |
| 地址: | 650091*** | 國(guó)省代碼: | 云南;53 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 特征 相似性 度量 階段 組合 黨建 視頻 推薦 方法 | ||
1.一種基于特征相似性度量的三階段組合黨建視頻推薦方法,其特征在于包括以下步驟:
步驟1:對(duì)黨建視頻內(nèi)容進(jìn)行特征篩選與提取,并對(duì)內(nèi)容特征數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理;
步驟1.1:對(duì)黨建視頻集進(jìn)行初始定義,其中表示第個(gè)源視頻,每個(gè)源視頻都具有的相關(guān)屬性:標(biāo)題,內(nèi)容,點(diǎn)擊量與時(shí)長(zhǎng),針對(duì)黨建視頻觀看的用戶集進(jìn)行初始定義,其中表示某一個(gè)用戶,提取視頻關(guān)聯(lián)的用戶總數(shù)為,黨建視頻推送的最終對(duì)象:黨員群體,是已知具有不同職業(yè)的特定人群,其中表示某職業(yè)屬性的某個(gè)黨員;
步驟1.2:對(duì)于網(wǎng)絡(luò)中存儲(chǔ)的海量黨建視頻,對(duì)其進(jìn)行篩選,主要篩選的特征包括:目標(biāo)年限,字幕,時(shí)長(zhǎng);
步驟1.3:抽取字幕內(nèi)容,將其作為源視頻文本內(nèi)容特征主要的源提取目標(biāo);
步驟1.4:將抽取出的每個(gè)字幕內(nèi)容文本,逐一分割成句子,去除文本中的格式,標(biāo)點(diǎn),停用詞,遍歷所有字幕內(nèi)容文本生成內(nèi)容特征:;
步驟1.5:將內(nèi)容特征數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理;而后,生成黨建視頻目標(biāo)內(nèi)容特征,其中為第個(gè)黨建視頻目標(biāo)內(nèi)容特征;
步驟2:提取單一用戶對(duì)黨建視頻的歷史偏好記錄學(xué)習(xí)偏好特征,遍歷用戶集的偏好記錄后,提取用戶集中用戶的偏好特征并運(yùn)用Rocchio算法生成對(duì)應(yīng)每一用戶擬推薦的黨建視頻;
步驟2.1:設(shè)某用戶對(duì)某個(gè)黨建視頻做出相關(guān)點(diǎn)擊觀看,已知此用戶對(duì)某個(gè)內(nèi)容特征的黨建視頻點(diǎn)擊,記為偏好喜歡,這對(duì)其他黨建視頻記為偏好不喜歡,擬計(jì)算該用戶的偏好記為:;
步驟2.2:運(yùn)用Rocchio反饋算法:;其中與為正負(fù)反饋權(quán)重,目的是控制判定結(jié)果和原始用戶偏好向量之間的平衡,,分別表示偏好集與中的已知實(shí)例;
步驟2.3:應(yīng)用余弦相似度計(jì)算與的相似性,對(duì)于某個(gè)給定的,使用與的相似度來(lái)代表用戶對(duì)黨建視頻的喜好度;
步驟2.4:遍歷所有用戶,得到對(duì)應(yīng)每一用戶擬推薦的黨建視頻;
步驟3:將用戶在黨建視頻內(nèi)容特征中歷史行為記錄的變化轉(zhuǎn)化為反饋偏好特征,重新將此類偏好特征加入偏好特征學(xué)習(xí)過(guò)程中;跳轉(zhuǎn)步驟2并更新偏好特征;
步驟3.1:初始化單一用戶的反饋特征為空,即;
步驟3.2:將此用戶觀看的首個(gè)黨建視頻的目標(biāo)內(nèi)容特征添加至中;
步驟3.3:依次遍歷所用此用戶觀看過(guò)的黨建視頻,逐一將目標(biāo)內(nèi)容特征更新至中;
步驟3.4:遍歷,去除冗余內(nèi)容特征;
步驟3.5:重復(fù)上述步驟3.4,直到提取出用戶集中所有用戶的反饋特征;
步驟4:對(duì)用戶屬性與偏好進(jìn)行特征提取;提取用戶集中相同黨建視頻重復(fù)點(diǎn)擊量及視頻跳躍觀看時(shí)長(zhǎng),以此作為用戶屬性特征;計(jì)算屬性特征的匹配度:;其中,表示與用戶有相同用戶特征信息的用戶子集;為權(quán)重閾值;遍歷用戶集并計(jì)算用戶間的特征信息匹配度;而后,計(jì)算用戶集中每一用戶的偏好相似度;設(shè)定用戶,瀏覽黨建視頻的集合;用戶,瀏覽黨建視頻的集合,其偏好相似度的計(jì)算為:;遍歷用戶集并計(jì)算用戶間的偏好相似度;
步驟5:根據(jù)用戶屬性特征的匹配度與用戶的偏好相似度,設(shè)置閾值權(quán)重:;運(yùn)用k-means算法對(duì)相似特征的用戶集進(jìn)行有效聚類分析,并對(duì)離群用戶進(jìn)行相關(guān)處理;
步驟6:結(jié)合步驟2生成的對(duì)應(yīng)每一用戶擬推薦的黨建視頻和步驟4中的用戶間的偏好相似度,重新聚類生成對(duì)相似用戶集推送的黨建視頻;提取黨建視頻標(biāo)題中的關(guān)鍵詞,將關(guān)鍵詞運(yùn)用余弦相似度度量算法來(lái)匹配不同職業(yè)黨員群體的屬性值,以此作為不同職業(yè)黨員群體的屬性標(biāo)識(shí)符;
步驟6.1:以職業(yè)屬性劃分黨員群體;
步驟6.2:針對(duì)以職業(yè)性質(zhì)劃分完成的黨員子集,建立各子集對(duì)應(yīng)的職業(yè)關(guān)鍵詞詞典,并將詞典中的每一個(gè)關(guān)鍵詞賦予唯一標(biāo)識(shí)符;
步驟6.3:將擬推薦視頻的標(biāo)題關(guān)鍵詞提取出來(lái),并記錄每個(gè)標(biāo)題關(guān)鍵詞所屬的黨建視頻,分別為這些標(biāo)題關(guān)鍵詞分配唯一的標(biāo)識(shí)符;
步驟6.4:統(tǒng)計(jì)標(biāo)題關(guān)鍵詞與詞典中關(guān)鍵詞相同的詞及對(duì)應(yīng)的詞頻;
步驟6.5:相似度計(jì)算:假設(shè)出現(xiàn)的某個(gè)標(biāo)題關(guān)鍵詞:;出現(xiàn)的詞頻:;某一職業(yè)關(guān)鍵詞詞典中出現(xiàn)的關(guān)鍵詞:;出現(xiàn)的詞頻:;
其中,表示兩個(gè)關(guān)鍵詞集中同一個(gè)詞,是它們分別對(duì)應(yīng)的詞頻,則,它們之間的余弦相似度可以表示為:;
步驟6.6:重復(fù)上述步驟6.5,計(jì)算所有視頻標(biāo)題關(guān)鍵詞與各子集職業(yè)關(guān)鍵詞的相似度;記錄相似度最大值的標(biāo)題關(guān)鍵詞與詞典對(duì)應(yīng)元組;
步驟6.7:將視頻標(biāo)題所屬的黨建視頻歸屬為黨員子集的屬性標(biāo)識(shí)符;
步驟7:計(jì)算相似用戶集擬推薦視頻的標(biāo)題關(guān)鍵詞與已生成的黨員群體屬性標(biāo)簽標(biāo)識(shí)符的相似度,最終將黨建視頻推送至目標(biāo)群體:具有不同職業(yè)身份的黨員群體中。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于云南大學(xué),未經(jīng)云南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711266644.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 基于異類關(guān)系確定目標(biāo)相似性的方法和系統(tǒng)
- 相似性匹配系統(tǒng)和方法
- 相似性匹配系統(tǒng)和方法
- 興趣點(diǎn)預(yù)測(cè)和推薦中的用戶時(shí)空相似性度量方法
- 一種基于相似性和邏輯矩陣分解的miRNA?疾病關(guān)聯(lián)關(guān)系預(yù)測(cè)方法
- 一種結(jié)合二分網(wǎng)絡(luò)和文本的醫(yī)院科室相似性分析方法
- 一種基于相似性學(xué)習(xí)及其增強(qiáng)的細(xì)胞類型鑒定方法
- 確定企業(yè)屬性相似性、重名對(duì)象判定
- 獲取機(jī)構(gòu)技術(shù)相似性的方法及裝置
- 一種基于圖卷積神經(jīng)網(wǎng)絡(luò)的lncRNA-蛋白質(zhì)相互作用預(yù)測(cè)方法





