[發明專利]一種聲音推薦方法、裝置、計算機設備和存儲介質在審
| 申請號: | 202210179939.3 | 申請日: | 2022-02-25 |
| 公開(公告)號: | CN114579797A | 公開(公告)日: | 2022-06-03 |
| 發明(設計)人: | 譚又偉;丁寧 | 申請(專利權)人: | 廣州歡聊網絡科技有限公司 |
| 主分類號: | G06F16/635 | 分類號: | G06F16/635 |
| 代理公司: | 廣州佳睿知識產權代理事務所(普通合伙) 44610 | 代理人: | 李健富 |
| 地址: | 510000 廣東省廣州市天*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 聲音 推薦 方法 裝置 計算機 設備 存儲 介質 | ||
本發明實施例涉及一種聲音推薦方法、裝置、計算機設備和存儲介質,所述方法包括:基于目標對象在歷史時間段內播放聲音的播放行為數據、正反饋行為數據、目標對象曝光的聲音數據確定目標對象對各主播的偏好權重,并基于目標對象對各主播的偏好權重確定目標對象的偏好主播集合:過濾目標對象的偏好主播集合中實時負反饋主播集合的主播,以及過濾目標對象的關注主播集合中實時負反饋主播集合的主播,并根據過濾后的偏好主播集合、關注主播集合召回主播所發布聲音并推薦給目標對象。提高了聲音推薦的準確性。
技術領域
本申請涉及計算機技術領域,具體是涉及一種聲音推薦方法、裝置、計算機設備和存儲介質。
背景技術
隨著計算機技術的不斷發展,在線音頻平臺也得到了日益廣泛的應用,用戶可以通過在線音頻平臺收聽各種各樣的聲音。在線音頻平臺會為用戶推薦聲音,傳統的聲音推薦方法包括基于索引推薦、item2vec、基于graph。
其中,基于索引推薦方法,其通過用戶行為,收集用戶標簽偏好,然后推薦含有該標簽的聲音。
缺點:
考慮粒度太粗,僅僅是考慮到用戶對標簽的偏好,沒有考慮用戶更細維度的偏好。
item2vec,其將用戶的行為序列視作一個句子,序列中的聲音視作詞,然后用word2vec模型進行訓練,就得到了聲音的embedding。
缺點:
馬太效應嚴重,用戶對長尾的聲音行為比較少,這些長尾聲音的embedding效果不理想;
聲音冷啟動問題嚴重,新的聲音還沒有用戶產生行為,因而新聲音不會出現在用戶的行為序列中,這樣就得不到新聲音的embedding。
基于graph,其基于用戶對聲音的行為構建graph,然后從每個結點為出發點,根據權重做隨機游走,這樣就可以形成新的聲音序列,最后對這些不同的聲音序列繼續使用word2vec模型,得到聲音的embedding向量。
缺點:
隨機游走策略,會引入比較大的噪聲;
馬太效應嚴重,用戶對長尾的聲音行為比較少,這些長尾聲音的embedding效果不理想;
聲音冷啟動問題嚴重,新的聲音還沒有用戶產生行為,因而新聲音不會出現在graph中,這樣就得不到新聲音的embedding。
發明內容
鑒于上述問題,提出了本發明以便提供一種克服上述問題或者至少部分地解決上述問題的一種聲音推薦方法、裝置、計算機設備和存儲介質,提高了聲音推薦的準確性。
第一方面,本發明實施例提供了一種聲音推薦方法,所述方法包括以下步驟:
獲取目標對象在設定的歷史時間段內播放聲音的歷史行為數據、目標對象曝光的聲音數據、關注主播集合、取消關注主播集合,以及目標對象在歷史時間段內最后N個預設時間周期內對主播曝光次數;所述歷史行為數據包括播放行為數據、正反饋行為數據;
基于目標對象在歷史時間段內的每個預設時間周期內對主播所發布聲音的播放行為的權重、時間衰減系數、播放行為TF-IDF值確定目標對象在相應預設時間周期內對相應主播的播放行為權重;基于目標對象在歷史時間段內的每個預設時間周期內對主播所發布聲音的正反饋行為的權重、時間衰減系數、正反饋行為TF-IDF值、正反饋行為次數確定目標對象在相應預設時間周期內對相應主播的正反饋行為權重;基于目標對象在各預設時間周期內對各主播的播放行為權重、以及目標對象在各預設時間周期內對各主播的正反饋行為權重確定目標對象對各主播的偏好權重;基于目標對象對各主播的偏好權重確定目標對象的偏好主播集合;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州歡聊網絡科技有限公司,未經廣州歡聊網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210179939.3/2.html,轉載請聲明來源鉆瓜專利網。





