[發(fā)明專利]商品匹配方法、裝置、電子設(shè)備、存儲介質(zhì)及程序產(chǎn)品在審
| 申請?zhí)枺?/td> | 202110841336.0 | 申請日: | 2021-07-23 |
| 公開(公告)號: | CN115700703A | 公開(公告)日: | 2023-02-07 |
| 發(fā)明(設(shè)計)人: | 韓強;喬勇 | 申請(專利權(quán))人: | 北京橙心無限科技發(fā)展有限公司 |
| 主分類號: | G06Q30/0601 | 分類號: | G06Q30/0601;G06F16/2457;G06F40/295 |
| 代理公司: | 北京超成律師事務(wù)所 11646 | 代理人: | 王曉菲 |
| 地址: | 100120 北京市朝陽區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 商品 匹配 方法 裝置 電子設(shè)備 存儲 介質(zhì) 程序 產(chǎn)品 | ||
本申請?zhí)峁┮环N商品匹配方法、裝置、電子設(shè)備、存儲介質(zhì)及程序產(chǎn)品,該方法包括:獲取待匹配的商品信息;待匹配的商品信息包括第一商品的第一商品信息和第二商品的第二商品信息;將各商品信息分別在各預(yù)設(shè)詞庫中進行匹配,若各預(yù)設(shè)詞庫中存在與商品信息相匹配的詞匯,確定該詞匯為商品信息中的目標詞匯,得到各商品信息的目標詞匯集;目標詞匯集中包括目標實體詞,目標實體詞為表征商品的實體類型的詞;若第一商品信息的目標詞匯集與第二商品信息中的目標詞匯集中的各目標詞匯完全匹配,確定第一商品和第二商品匹配。本方案無需依賴分詞器,對于目標詞匯的提取更為準確,且可以排除商品信息中夾雜的無用修飾詞的影響,商品匹配判斷更為精準。
技術(shù)領(lǐng)域
本申請涉及信息匹配技術(shù)領(lǐng)域,具體而言,涉及一種商品匹配方法、裝置、電子設(shè)備、存儲介質(zhì)及程序產(chǎn)品。
背景技術(shù)
目前,對于商品匹配普遍使用相似度匹配的方法來實現(xiàn)。具體的,通過對所需匹配的各商品信息進行分詞器分詞,然后對分詞后的各詞進行詞向量構(gòu)建,使用TF-IDF(termfrequency–inverse document frequency,詞頻-逆向文件頻率)的方式根據(jù)各詞向量綜合計算得到一個表征詞向量,最后對各商品信息對應(yīng)的表征詞向量進行相似度計算,進而依據(jù)獲得的相似度得分,確定各商品信息之間是否匹配。
但是,現(xiàn)有技術(shù)在電商領(lǐng)域存在天然的缺點,很難在真實場景下精準地判斷兩個商品是否完全匹配,具體原因如下:
(1)專業(yè)電商領(lǐng)域一般使用jieba(結(jié)巴)等分詞器來進行分詞,受限于分詞器本身的準確性,分詞器很難對商品信息進行精準的切詞,從而會導(dǎo)致相似度計算不準確,影響最后的匹配效果。
(2)在采用現(xiàn)有技術(shù)進行計算時,商品信息中夾雜的修飾詞也會被用來進行計算,比如商品信息存在有諸如“618”、“年中大促”等對于商品本身的匹配與否并無影響的詞匯,現(xiàn)有技術(shù)中在計算相似度時會將其計算進去,這也將嚴重影響最后計算得到相似度結(jié)果,從而導(dǎo)致無法精準地判斷兩個商品是否完全匹配。
發(fā)明內(nèi)容
本申請實施例的目的在于提供一種商品匹配方法、裝置、電子設(shè)備、存儲介質(zhì)及程序產(chǎn)品,用以實現(xiàn)在真實場景下更精準地判斷兩個商品是否完全匹配。
本申請實施例公開了TS1、一種商品匹配方法,包括:獲取待匹配的商品信息;所述待匹配的商品信息包括第一商品的第一商品信息和第二商品的第二商品信息;將各所述商品信息分別在各預(yù)設(shè)詞庫中進行匹配,若各所述預(yù)設(shè)詞庫中存在與所述商品信息相匹配的詞匯,確定該詞匯為所述商品信息中的目標詞匯,得到各所述商品信息的目標詞匯集;所述目標詞匯集中包括目標實體詞,所述目標實體詞為表征商品的實體類型的詞;若所述第一商品信息的目標詞匯集與所述第二商品信息中的目標詞匯集中的各目標詞匯完全匹配,確定所述第一商品和所述第二商品匹配。
在上述實現(xiàn)過程中,通過將各商品信息分別在各預(yù)設(shè)詞庫中進行匹配,從而可以在不采用分詞器的情況下,實現(xiàn)對于商品信息中的目標詞匯的提取,得到各所述商品信息的目標詞匯集。這樣對于各個商品信息而言,得到的目標詞匯集必然為預(yù)設(shè)詞庫中存在的詞匯,相比于利用分詞器分詞的方案,對于目標詞匯的提取更為精確,從而匹配效果可以更好。
此外,在上述實現(xiàn)過程中,由于是通過詞庫匹配的方式提取出的目標詞匯集,僅針對目標詞匯集中的各目標詞匯進行匹配,從而確定出第一商品和第二商品是否匹配。因此對于諸如“618”、“年中大促”等對于商品本身的匹配與否并無影響的詞匯,其不會作為目標詞匯被提取到,從而可以有效避免商品信息中夾雜的無用修飾詞對于最終匹配結(jié)果的影響,從而相比于現(xiàn)有技術(shù),對于兩個商品是否完全匹配的判斷可以更為精準。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京橙心無限科技發(fā)展有限公司,未經(jīng)北京橙心無限科技發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110841336.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類





