[發明專利]標簽映射方法、裝置、計算機設備及存儲介質有效
| 申請號: | 202010870420.0 | 申請日: | 2020-08-26 |
| 公開(公告)號: | CN111931061B | 公開(公告)日: | 2023-03-24 |
| 發明(設計)人: | 劉剛 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/9532 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 張所明 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 標簽 映射 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種標簽映射方法,其特征在于,所述方法包括:
獲取目標內容的內容文本;
獲取所述目標內容的原始標簽;所述目標內容的原始標簽是基于指定的內容推薦平臺的標簽體系之外的其它標簽體系構建的標簽;或者,所述目標內容的原始標簽是未按照任一標簽體系構建的標簽;
將所述目標內容的內容文本以及所述目標內容的原始標簽輸入至向量融合模型,獲得所述向量融合模型輸出的所述目標內容的內容標簽融合向量;所述向量融合模型是以內容樣本的內容文本以及所述內容樣本的原始標簽為輸入,以所述內容樣本的樣本標簽為目標進行訓練獲得的;所述內容樣本的原始標簽和樣本標簽的獲取過程包括:獲取所述內容樣本的至少兩個標簽,所述至少兩個標簽屬于各個候選標簽;所述各個候選標簽是所述指定的內容推薦平臺的標簽體系中的各個標簽;獲取所述至少兩個標簽與所述內容樣本的相關性;將所述至少兩個標簽按照對應的相關性從大到小的順序進行排列;將所述至少兩個標簽中,排在前N位的標簽設置為所述內容樣本的原始標簽,并將所述至少兩個標簽中的其余部分標簽設置為所述內容樣本的樣本標簽;其中,1≤N≤M,且N、M為整數;M為所述至少兩個標簽的數量;
將所述內容標簽融合向量與各個候選標簽的標簽向量進行相似度計算;
基于所述內容標簽融合向量與所述各個候選標簽的標簽向量之間的相似度,從所述各個候選標簽中獲取所述目標內容對應的目標標簽。
2.根據權利要求1所述的方法,其特征在于,所述將所述目標內容的內容文本以及所述目標內容的原始標簽輸入至向量融合模型,獲得所述向量融合模型輸出的所述內容標簽融合向量,包括:
通過所述向量融合模型中的第一向量轉化層,將所述目標內容的內容文本轉化為文本向量;
通過所述向量融合模型中的第二向量轉化層,將所述目標內容的原始標簽轉化為原始標簽向量;
基于注意力機制的方式將所述文本向量和所述原始標簽向量進行向量融合,獲得所述內容標簽融合向量。
3.根據權利要求2所述的方法,其特征在于,所述基于注意力機制的方式將所述文本向量和所述原始標簽向量進行向量融合,獲得所述內容標簽融合向量,包括:
以所述文本向量為查詢輸入,基于注意力機制的方式獲取所述原始標簽向量的權重;
基于所述原始標簽向量的權重,對所述原始標簽向量進行加權求和,獲得所述原始標簽向量的加權和向量;
將所述文本向量以及所述加權和向量進行融合,獲得所述內容標簽融合向量。
4.根據權利要求1至3任一所述的方法,其特征在于,所述基于所述內容標簽融合向量與所述各個候選標簽的標簽向量之間的相似度,從所述各個候選標簽中獲取所述目標內容對應的目標標簽,包括:
將所述各個候選標簽按照對應的標簽向量與所述內容標簽融合向量之間的相似度從高到低的順序排列;
將所述各個候選標簽中,排列在前K位的候選標簽獲取為所述目標標簽;K為大于或者等于1的整數。
5.根據權利要求1至3任一所述的方法,其特征在于,所述獲取目標內容的內容文本,包括:
響應于所述目標內容是音視頻內容,將所述音視頻內容的標題獲取為所述目標內容的內容文本;
響應于所述目標內容是圖像內容,將所述圖像內容的標題,以及所述圖像內容的光學字符識別結果獲取為所述目標內容的內容文本;
響應于所述目標內容是文本內容,將所述文本內容的標題,以及所述文本內容中的部分或全部文本,獲取為所述目標內容的內容文本。
6.根據權利要求1至3任一所述的方法,其特征在于,所述獲取所述目標內容的原始標簽,包括:
從所述目標內容所屬的內容平臺中獲取所述目標內容的原始標簽;
或者,對所述內容文本進行關鍵詞提取,獲得所述目標內容的原始標簽;
或者,從所述目標內容的屬性信息中讀取所述目標內容的原始標簽。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010870420.0/1.html,轉載請聲明來源鉆瓜專利網。





