[發(fā)明專利]基于顯隱性潛在因子模型的電視產(chǎn)品精準(zhǔn)推薦方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201910085589.2 | 申請(qǐng)日: | 2019-01-29 |
| 公開(公告)號(hào): | CN109963175B | 公開(公告)日: | 2020-12-15 |
| 發(fā)明(設(shè)計(jì))人: | 奚琪;桂智杰;李創(chuàng);項(xiàng)永明;楊萍 | 申請(qǐng)(專利權(quán))人: | 中國人民解放軍戰(zhàn)略支援部隊(duì)信息工程大學(xué) |
| 主分類號(hào): | H04N21/258 | 分類號(hào): | H04N21/258;H04N21/25;H04N21/845;H04N21/81;H04L29/08;G06K9/62 |
| 代理公司: | 鄭州大通專利商標(biāo)代理有限公司 41111 | 代理人: | 陳勇 |
| 地址: | 450000 河*** | 國省代碼: | 河南;41 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 隱性 潛在 因子 模型 電視 產(chǎn)品 精準(zhǔn) 推薦 方法 系統(tǒng) | ||
1.一種基于顯隱性潛在因子模型的電視產(chǎn)品精準(zhǔn)推薦方法,其特征在于,包括以下步驟:
步驟1:電視產(chǎn)品正題名通過正則表達(dá)式進(jìn)行處理,綜合考慮多種反爬蟲機(jī)制,設(shè)計(jì)爬蟲策略,對(duì)所需的外部數(shù)據(jù)進(jìn)行爬?。?/p>
步驟2:根據(jù)電視產(chǎn)品和用戶人群的不同特征,分別建立針對(duì)電視產(chǎn)品和用戶人群的分類模型,通過所述分類模型實(shí)現(xiàn)對(duì)電視產(chǎn)品信息和用戶信息的自動(dòng)標(biāo)簽標(biāo)注,得到標(biāo)注標(biāo)簽后的電視產(chǎn)品信息和標(biāo)注標(biāo)簽后的用戶信息;
步驟3:依據(jù)標(biāo)注標(biāo)簽后的電視產(chǎn)品信息和標(biāo)注標(biāo)簽后的用戶信息及爬取的外部數(shù)據(jù)得出顯性潛在因子,所述顯性潛在因子包括電視產(chǎn)品顯性潛在因子和用戶顯性潛在因子,通過顯性潛在因子得出隱性潛在因子,基于顯性潛在因子及隱性潛在因子構(gòu)建顯隱性潛在因子模型;
所述步驟3包括:
步驟3.1:依據(jù)標(biāo)注標(biāo)簽后的電視產(chǎn)品信息和爬取的外部數(shù)據(jù)得出電視產(chǎn)品顯性潛在因子,所述電視產(chǎn)品顯性潛在因子包括電視產(chǎn)品適用人群、電視產(chǎn)品靜態(tài)參數(shù)及電視產(chǎn)品類別信息,所述電視產(chǎn)品靜態(tài)參數(shù)包括電視產(chǎn)品的導(dǎo)演、演員、出品年代、聲道語種和地區(qū)參數(shù);
步驟3.2:依據(jù)標(biāo)注標(biāo)簽后的用戶信息和爬取的外部數(shù)據(jù)得出用戶顯性潛在因子,所述用戶顯性潛在因子包括用戶家庭成員、用戶瀏覽特征及用戶收視偏好;
步驟3.3:將除電視產(chǎn)品顯性潛在因子和用戶顯性潛在因子以外的電視產(chǎn)品和用戶人群的特征定義為隱性潛在因子;
步驟3.4:對(duì)所述隱性潛在因子進(jìn)行求解:
設(shè)隱性潛在因子有n維,顯性潛在因子為m維,其中n為未知維數(shù),m為已知的顯性潛在因子維數(shù),則總的潛在因子空間維度為f=m+n,基于傳統(tǒng)潛在因子模型,在確定顯性潛在因子的條件下,訓(xùn)練出n維未知的隱性潛在因子;
步驟3.5:將電視產(chǎn)品顯性潛在因子、用戶顯性潛在因子及隱性潛在因子共同構(gòu)成顯隱性潛在因子矩陣,所述顯隱性潛在因子矩陣包括用戶顯隱性潛在因子矩陣P和電視產(chǎn)品顯隱性潛在因子矩陣Q,通過如下方式計(jì)算P和Q:
定義損失函數(shù):
其中,L是損失函數(shù);pi是用戶i的顯隱性潛在因子向量,qj是電視產(chǎn)品j的顯隱性潛在因子向量;si,j是用戶i對(duì)電視產(chǎn)品j的評(píng)分;λ為懲罰因子;
在損失函數(shù)中加入基準(zhǔn)偏置項(xiàng):
bi,j=μ+bi+bj
其中,μ表示所有用戶對(duì)電視產(chǎn)品打分的平均值,bi和bj分別表示用戶i和電視產(chǎn)品j的基準(zhǔn)偏置,將上述基準(zhǔn)偏置項(xiàng)加入到原損失函數(shù)的表達(dá)式中可得如下目標(biāo)函數(shù)表達(dá)式:
分別對(duì)上式的bi、bj、pi和qj求偏導(dǎo),通過隨機(jī)梯度下降法求解參數(shù)bi、bj、pi和qj,根據(jù)隨機(jī)梯度下降法,在訓(xùn)練的過程中,各個(gè)參數(shù)都做如下更新:
其中,γ為學(xué)習(xí)步長;
步驟3.6:通過步驟3.1-步驟3.5完成顯隱性潛在因子模型的構(gòu)建;
步驟4:基于構(gòu)建的顯隱性潛在因子模型進(jìn)行電視產(chǎn)品的推薦。
2.根據(jù)權(quán)利要求1所述的基于顯隱性潛在因子模型的電視產(chǎn)品精準(zhǔn)推薦方法,其特征在于,所述步驟1包括:
步驟1.1:設(shè)計(jì)反爬蟲機(jī)制,所述反爬蟲機(jī)制包括采用模擬Ajax請(qǐng)求的方式,主動(dòng)發(fā)起異步請(qǐng)求獲取所需數(shù)據(jù);
步驟1.2:根據(jù)反爬蟲機(jī)制設(shè)計(jì)網(wǎng)絡(luò)爬蟲算法,對(duì)網(wǎng)頁數(shù)據(jù)進(jìn)行爬?。?/p>
采取所述反爬蟲機(jī)制不斷發(fā)起Http請(qǐng)求,然后接收Http回應(yīng),解析得到的HTML文件,如果是確定的結(jié)構(gòu),直接匹配得到標(biāo)簽中的數(shù)據(jù);
如果結(jié)構(gòu)為非確定的,則對(duì)整個(gè)DOM樹進(jìn)行遍歷搜索,獲取標(biāo)簽中的數(shù)據(jù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國人民解放軍戰(zhàn)略支援部隊(duì)信息工程大學(xué),未經(jīng)中國人民解放軍戰(zhàn)略支援部隊(duì)信息工程大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910085589.2/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
H04N 圖像通信,如電視
H04N21-00 可選的內(nèi)容分發(fā),例如交互式電視,VOD〔視頻點(diǎn)播〕
H04N21-20 .專門適用于內(nèi)容分發(fā)的專用服務(wù)器,例如:VOD服務(wù)器;其操作
H04N21-40 .專門適用于接收內(nèi)容或者與內(nèi)容交互的客戶端設(shè)備,如STB[機(jī)頂盒];相關(guān)操作
H04N21-60 .用于在服務(wù)器和客戶端之間或者在遠(yuǎn)程客戶端之間的視頻分配的網(wǎng)絡(luò)結(jié)構(gòu)或者處理
H04N21-80 .通過內(nèi)容產(chǎn)生器獨(dú)立于分配過程實(shí)現(xiàn)的內(nèi)容或附加數(shù)據(jù)的生成或處理;內(nèi)容本身
H04N21-81 ..其單媒體部件
- 隱性白羽矮腳雞種質(zhì)資源的培育方法及其配套應(yīng)用
- 油光葉隱性核不育純合兩型系和油光葉臨保系的選育方法和應(yīng)用
- 一種利用FGF21因子診斷奶牛隱性酮病的方法
- 一種模具設(shè)計(jì)隱性知識(shí)采集和搜索方法
- 一種繼電保護(hù)裝置的隱性故障檢測方法
- 一種基于潮流斷面的隱性故障風(fēng)險(xiǎn)評(píng)估方法
- 一種基于歷史數(shù)據(jù)的模具設(shè)計(jì)人員隱性知識(shí)能力自動(dòng)評(píng)估方法
- 一種交通安全隱性因子的信用評(píng)分方法
- 一種基于生物隱性形狀獲取的產(chǎn)品形狀設(shè)計(jì)方法
- 淡水魚中隱性孔雀石綠的快速提取和檢測方法
- Ⅶ因子多肽和Ⅷ因子多肽的聯(lián)合應(yīng)用
- VII因子多肽和IX因子多肽的聯(lián)合應(yīng)用
- 一種城鄉(xiāng)生態(tài)規(guī)劃的生態(tài)等級(jí)空間分區(qū)規(guī)劃控制方法
- 一種基于阿爾法散度的動(dòng)態(tài)PET圖像因子處理方法
- 一種設(shè)備綜合風(fēng)險(xiǎn)評(píng)估方法、裝置和電力系統(tǒng)
- 一種集群資源容量預(yù)測方法和裝置
- 一種計(jì)算因子植入方法、介質(zhì)及設(shè)備
- 一種規(guī)模組網(wǎng)環(huán)境TI-LFA可靠性評(píng)估測試方法
- 近地表品質(zhì)因子確定方法及系統(tǒng)
- 一種模擬凝血過程的教學(xué)模型





