[發明專利]數據處理方法、文本顯示方法、數據處理系統及設備在審
| 申請號: | 202211460790.2 | 申請日: | 2022-11-21 |
| 公開(公告)號: | CN115828862A | 公開(公告)日: | 2023-03-21 |
| 發明(設計)人: | 魯志紅;趙帥帥;劉敏 | 申請(專利權)人: | 阿里巴巴(中國)有限公司 |
| 主分類號: | G06F40/166 | 分類號: | G06F40/166;G06F16/33;G06F16/35;G06F16/383;G06F3/0484;G06Q30/0601 |
| 代理公司: | 北京太合九思知識產權代理有限公司 11610 | 代理人: | 柴艷波 |
| 地址: | 311121 浙江省杭州市余杭*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據處理 方法 文本 顯示 數據處理系統 設備 | ||
1.一種數據處理方法,其特征在于,適于服務端,所述方法包括:
從多個數據源,獲取目標商品關聯的多媒體數據;
對所述多媒體數據進行處理,得到多個文本信息;
基于商品文案對應的多個類目,分別為所述多個文本信息確定相應的類目;
對所述多個文本信息按類目進行文本編輯,得到所述目標商品的結構化描述文本。
2.根據權利要求1所述的方法,其特征在于,對所述多媒體數據進行處理,得到多個文本信息,包括:
對所述多媒體數據進行文本化處理,得到至少一個文本信息;
基于所述多媒體數據,在商品賣點文案庫中查詢與所述目標商品適配的至少一個文本信息。
3.根據權利要求2所述的方法,其特征在于,所述多媒體數據包括所述目標商品的屬性信息,所述屬性信息包括商品標題、商品類別及商品屬性數據;
以及
基于所述多媒體數據,在商品賣點文案庫中查詢與所述目標商品適配的至少一個文本信息,包括如下中的至少一項:
利用深度語義匹配模型,從所述商品賣點庫中召回與所述屬性信息匹配的至少一個第一賣點文案;
從所述商品賣點庫中,召回與所述目標商品的商品類別相對應的至少一個第二賣點文案;
根據所述至少一個第一賣點文案和所述至少一個第二賣點文案,確定與所述目標商品賣點相關的至少一個文本信息。
4.根據權利要求2所述的方法,其特征在于,所述多媒體數據包括如下中的至少一項:所述目標商品的主圖片、所述目標商品的第一商品詳情信息、所述目標商品相關的第一音頻信息、所述目標商品相關的第一視頻信息、與所述目標商品同款商品的第二商品詳情信息、與所述目標商品同款商品的第二音頻信息、與所述目標商品同款商品的第二視頻信息;
其中,商品詳情信息包括詳情圖片和/或詳情文本;
以及
對所述多媒體數據進行文本化處理,得到至少一個文本信息,包括如下中的至少一項:
利用圖片描述技術,對所述主圖片進行識別,生成描述所述主圖片的文本信息;
對所述第一音頻信息和/或所述第二音頻信息進行語音識別,基于語音識別結果生成與所述目標商品相關的文本信息;
對所述第一商品詳情信息和/或所述第二商品詳情信息中的詳情圖片進行文字識別,根據文字識別結果生成文本信息;
基于所述第一商品詳情信息和/或所述第二商品詳情信息中的詳情文本,獲得至少一個文本信息;
對所述第一視頻信息和/或第二視頻信息中抽取關鍵幀,對所述關鍵幀進行圖像識別,根據圖像識別結果生成與所述目標商品相關的文本信息。
5.根據權利要求1至4中任一項所述的方法,其特征在于,從多個數據源,獲取目標商品關聯的多媒體數據,包括:
從商品信息庫中,獲取所述目標商品的主圖片、商品詳情信息和/或屬性信息;
從音視頻信息庫中,獲取所述目標商品相關的第一視頻信息和/或第一音頻信息;
從互聯網側,獲取所述目標商品的多媒體數據以及與所述目標商品同款商品的多媒體數據。
6.根據權利要求1至4中任一項所述的方法,其特征在于,還包括:
基于所述目標商品的屬性信息,確定所述多個類目;或者
根據商品文案預配置信息,獲取所述多個類目。
7.根據權利要求6所述的方法,其特征在于,基于商品文案對應的多個類目,分別為所述多個文本信息確定相應的類目,包括:
獲取分類模型;
將所述多個類目及所述多個文本信息輸入所述分類模型,執行所述分類模型,得到所述多個文本信息對應的類目。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴(中國)有限公司,未經阿里巴巴(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211460790.2/1.html,轉載請聲明來源鉆瓜專利網。





