[發明專利]一種相似內容確定方法和裝置在審
| 申請號: | 202211649784.1 | 申請日: | 2022-12-21 |
| 公開(公告)號: | CN116340551A | 公開(公告)日: | 2023-06-27 |
| 發明(設計)人: | 郝錕鵬;龐鋒;賈遂賓 | 申請(專利權)人: | 微夢創科網絡科技(中國)有限公司 |
| 主分類號: | G06F16/48 | 分類號: | G06F16/48;G06F18/22;G06F18/25 |
| 代理公司: | 北京卓嵐智財知識產權代理有限公司 11624 | 代理人: | 張旭東 |
| 地址: | 100193 北京市海淀區東北旺西路中關村*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 相似 內容 確定 方法 裝置 | ||
1.一種相似內容確定方法,其特征在于,包括:
按內容類別從目標內容中獲取每種內容類別各自對應的至少一個目標子內容;
針對每種內容類別,將所述內容類別所對應的至少一個目標子內容向量化,得到所述內容類別對應的至少一個目標子內容向量;
根據候選相似內容集合中候選相似內容的每種內容類別對應的至少一個候選相似子內容向量、以及所述目標內容的每種內容類別對應的至少一個目標子內容向量,確定所述候選相似內容與所述目標內容之間的多模態相似度;
根據候選相似內容集合中每個所述候選相似內容與所述目標內容之間的多模態相似度,從所述候選相似內容集合中確定與所述目標內容相匹配的相似內容;
其中,所述候選相似內容集合包括至少一個候選相似內容;按所述內容類別從每個候選相似內容中獲取每種內容類別各自對應的至少一個候選相似子內容,針對每個候選相似內容的每種內容類別,將所述內容類別所對應的至少一個候選相似子內容向量化,得到所述內容類別對應的至少一個候選相似子內容向量。
2.如權利要求1所述的相似內容確定方法,其特征在于,所述內容類別包括:文本、圖片、視頻;
所述針對每種內容類別,將所述內容類別所對應的至少一個目標子內容向量化,得到所述內容類別對應的至少一個目標子內容向量,包括:
在所述目標內容包括文本的情況下,將所述目標內容中的全部文本向量化為對應的目標文本向量;
在所述目標內容包括圖片情況下,將所述目標內容中的至少一個圖片分別對應向量化為至少一個目標圖片向量;
在所述目標內容包括視頻情況下,將所述目標內容中的視頻向量化為對應的目標視頻片段向量序列;
其中,所述目標子內容向量包括:目標文本向量、目標圖片向量、和/或目標視頻片段向量序列。
3.如權利要求2所述的相似內容確定方法,其特征在于,所述根據候選相似內容集合中候選相似內容的每種內容類別對應的至少一個候選相似子內容向量、以及所述目標內容的每種內容類別對應的至少一個目標子內容向量,確定所述候選相似內容與所述目標內容之間的多模態相似度,包括:
針對所述候選相似內容集合中的每個候選相似內容,根據所述候選相似內容的每種內容類別對應的至少一個候選相似子內容向量與所述目標內容的同一內容類別對應的至少一個目標子內容向量的距離,計算所述候選相似內容的所述內容類別對應的相似得分;
將所述候選相似內容的所有內容類別各自對應的相似得分作為所述候選相似內容與所述目標內容之間的多模態相似度。
4.如權利要求3所述的相似內容確定方法,其特征在于,所述針對所述候選相似內容集合中的每個候選相似內容,根據所述候選相似內容的每種內容類別對應的至少一個候選相似子內容向量與所述目標內容的同一內容類別對應的至少一個目標子內容向量的距離,計算所述候選相似內容的所述內容類別對應的相似得分,包括:
根據所述目標內容中的全部文本的文本屬性生成文本置信參數;
針對每個候選相似內容,將所述目標文本向量與所述候選相似內容的全部文本對應的候選相似文本向量的距離作為文本向量距離,并且將所述文本向量距離與所述文本置信參數的乘積作為所述候選相似內容和所述目標內容中的文本對應的相似得分;
其中,所述候選相似文本向量是通過對所述候選相似內容中的全部文本向量化后得到的向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微夢創科網絡科技(中國)有限公司,未經微夢創科網絡科技(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211649784.1/1.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





