[發明專利]核心商品詞挖掘方法、裝置、電子設備及存儲介質有效
| 申請號: | 202010601024.8 | 申請日: | 2020-06-28 |
| 公開(公告)號: | CN111881674B | 公開(公告)日: | 2023-07-25 |
| 發明(設計)人: | 黃志標;裴一飛 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06Q30/0601;G06F16/335 |
| 代理公司: | 北京鴻德海業知識產權代理有限公司 11412 | 代理人: | 谷春靜 |
| 地址: | 100085 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 核心 商品 挖掘 方法 裝置 電子設備 存儲 介質 | ||
本申請公開了核心商品詞挖掘方法、裝置、電子設備及存儲介質,涉及人工智能、電子商務、自然語言處理及互聯網領域,其中的方法可包括:對待處理的商品的商品標題進行分詞;分別獲取分詞得到的各詞項的權重;從各詞項中確定出極核心詞;根據極核心詞及所述權重確定出候選核心商品詞;根據候選核心商品詞及商品的預定維度信息確定出核心商品詞。應用本申請所述方案,可降低實現成本及提升挖掘出的核心商品詞的準確性等。
技術領域
本申請涉及計算機應用技術,特別涉及人工智能、電子商務、自然語言處理及互聯網領域的核心商品詞挖掘方法、裝置、電子設備及存儲介質。
背景技術
核心商品詞是指賣家銷售給買家的具體商品或服務,在電子商務等場景具有廣泛應用,如可基于核心商品詞進行相似商品推薦等。為此,需要預先挖掘出商品的核心商品詞。
目前,在挖掘核心商品詞時,通常采用以下方式:將商品標題輸入預先訓練得到的模型中,根據模型的輸出確定出核心商品詞。但這種方式中所采用的模型通常復雜度較高,訓練時間很長,而且,當行業差異較大時,需要針對不同行業訓練不同的模型,實現成本很高。
發明內容
本申請提供了核心商品詞挖掘方法、裝置、電子設備及存儲介質。
一種核心商品詞挖掘方法,包括:
對待處理的商品的商品標題進行分詞;
分別獲取分詞得到的各詞項的權重;
從各詞項中確定出極核心詞;
根據所述極核心詞及所述權重確定出候選核心商品詞;
根據所述候選核心商品詞及所述商品的預定維度信息確定出核心商品詞。
一種核心商品詞挖掘裝置,包括:標題分詞模塊、權重獲取模塊、候選確定模塊以及商品詞確定模塊;
所述標題分詞模塊,用于對待處理的商品的商品標題進行分詞;
所述權重獲取模塊,用于分別獲取分詞得到的各詞項的權重;
所述候選確定模塊,用于從各詞項中確定出極核心詞,根據所述極核心詞及所述權重確定出候選核心商品詞;
所述商品詞確定模塊,用于根據所述候選核心商品詞及所述商品的預定維度信息確定出核心商品詞。
一種電子設備,包括:
至少一個處理器;以及
與所述至少一個處理器通信連接的存儲器;其中,
所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行如以上所述的方法。
一種存儲有計算機指令的非瞬時計算機可讀存儲介質,所述計算機指令用于使所述計算機執行如以上所述的方法。
一種計算機程序產品,包括計算機程序,所述計算機程序在被處理器執行時實現如以上所述的方法。
上述申請中的一個實施例具有如下優點或有益效果:可通過對商品標題進行分詞等確定出候選核心商品詞,并可結合商品的預定維度信息,最終確定出核心商品詞,相比于現有方式,本申請所述方式無需進行模型的訓練等,從而降低了實現成本,而且,除商品標題外,進一步結合了商品的預定維度信息來最終確定出核心商品詞,從而提升了挖掘出的核心商品詞的準確性等。
應當理解,本部分所描述的內容并非旨在標識本公開的實施例的關鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
附圖說明
附圖用于更好地理解本方案,不構成對本申請的限定。其中:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010601024.8/2.html,轉載請聲明來源鉆瓜專利網。





