[發明專利]關鍵詞提取方法、裝置、設備和存儲介質在審
| 申請號: | 202110400595.X | 申請日: | 2021-04-14 |
| 公開(公告)號: | CN113076755A | 公開(公告)日: | 2021-07-06 |
| 發明(設計)人: | 王玥;李浩然;祝天剛 | 申請(專利權)人: | 京東數字科技控股股份有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06K9/34;G06N3/04 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 朱穎;臧建明 |
| 地址: | 100176 北京市北京經濟*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 關鍵詞 提取 方法 裝置 設備 存儲 介質 | ||
本申請提供一種關鍵詞提取方法、裝置、設備和存儲介質,其中,該方法包括:獲取與物品的屬性相關的描述文本和物品的圖片;對所述描述文本進行編碼處理,得到所述描述文本的語義表示;對所述圖片進行特征提取,得到所述圖片的語義向量;利用預先訓練得到的目標模型,根據所述語義向量和語義表示,獲取所述物品的屬性詞。該技術方案中,通過使用物品的圖片輔助從物品的描述文本中提取得到屬性詞,能夠提高物品屬性詞提取的準確度和效果。
技術領域
本申請涉及機器學習技術領域,尤其涉及一種關鍵詞提取方法、裝置、設備和存儲介質。
背景技術
對于每一個物品,其都有對應的屬性信息,屬性信息具體包括有屬性和該屬性對應的屬性值,例如家電設備的顏色可以對應為白色,用戶通過查看該物品的屬性信息,即可對物品有更加深入詳細的了解,為此,每一個物品都需要配置完善的屬性信息。
現有技術中,在配置物品的屬性信息時,通常是從給定的一段物品的描述文本中抽取得到物品的屬性信息,即識別描述文本中哪些詞是用來描述物品屬性的詞語,并將這些詞語抽取出來,最終得到物品的屬性信息。
現有技術采用的這種從物品的描述文本中抽取物品的屬性信息的方式,由于描述文本涉及的內容多,在抽取過程中容易產生混淆,出現詞語無法識別或者識別不準確的情況,使得最終得到的物品的屬性信息存在缺失,導致屬性信息的提取效果差。
發明內容
本申請提供一種關鍵詞提取方法、裝置、設備和存儲介質,用于解決現有的物品屬性信息提取效果差的問題。
第一方面,本申請實施例提供一種關鍵詞提取方法,包括:
獲取與物品的屬性相關的描述文本和物品的圖片;
對所述描述文本進行編碼處理,得到所述描述文本的語義表示;
對所述圖片進行特征提取,得到所述圖片的語義向量;
利用預先訓練得到的目標模型,根據所述語義向量和語義表示,獲取所述物品的屬性詞,所述屬性詞用于指示所述物品的屬性。
第二方面,本申請實施例提供一種關鍵詞提取裝置,包括:
獲取模塊,用于獲取與物品的屬性相關的描述文本和物品的圖片;
編碼模塊,用于對所述描述文本進行編碼處理,得到所述描述文本的語義表示;
提取模塊,用于對所述圖片進行特征提取,得到所述圖片的語義向量;
模型輸出模塊,用于利用預先訓練得到的目標模型,根據所述語義向量和語義表示,獲取所述物品的屬性詞,所述屬性詞用于描述所述物品的屬性。
第三方面,本申請實施例提供一種計算機設備,包括存儲器和至少一個處理器;
所述存儲器存儲計算機執行指令;
所述至少一個處理器執行所述存儲器存儲的計算機執行指令,使得所述至少一個處理器執行如上所述的方法。
第四方面,本申請實施例提供一種計算機可讀存儲介質,其上存儲有計算機程序,所述計算機可讀存儲介質中存儲有計算機指令,所述計算機指令被處理器執行時用于實現如上所述的方法。
第五方面,本申請實施例提供一種計算機程序產品,包括計算機程序/指令,該計算機程序/指令被處理器執行時實現如上所述的方法。
本申請實施例提供的關鍵詞提取方法、裝置、設備和存儲介質,在從描述文本中提取物品的屬性詞的過程中,通過使用物品的圖片作為輔助,使得描述文本與圖片中的視覺特征融合,以輔助補齊物品的屬性詞,能夠避免只單獨從描述文本中提取物品的屬性詞存在缺失的情況,提高物品屬性的詞提取效果。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于京東數字科技控股股份有限公司,未經京東數字科技控股股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110400595.X/2.html,轉載請聲明來源鉆瓜專利網。





