[發明專利]品牌詞識別方法、裝置、設備及存儲介質有效
| 申請號: | 201810723842.8 | 申請日: | 2018-07-04 |
| 公開(公告)號: | CN110750985B | 公開(公告)日: | 2023-07-11 |
| 發明(設計)人: | 馬春平;謝朋峻;李林琳;司羅 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06F40/247 |
| 代理公司: | 北京東方億思知識產權代理有限責任公司 11258 | 代理人: | 吳崇 |
| 地址: | 開曼群島*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 品牌 識別 方法 裝置 設備 存儲 介質 | ||
本發明實施例公開了一種品牌詞識別方法、裝置、設備及存儲介質。該方法包括:選擇第一產品對象的描述信息;確定描述信息所屬類目,并將描述信息進行分詞處理,得到描述信息對應的關鍵字集合;從關鍵字集合中選取目標關鍵字,并確定目標關鍵字對應的類目;若描述信息所屬類目與目標關鍵字對應的類目一致,則識別目標關鍵字為品牌詞。本發明實施例的品牌詞識別方法、裝置、設備及存儲介質,能夠提高品牌詞識別的準確率、召回率和效率。
技術領域
本發明涉及計算機技術領域,尤其涉及一種品牌詞識別方法、裝置、設備及存儲介質。
背景技術
品牌是一種名稱、術語、標記、符號或圖案,或是他們的相互組合,用以識別企業提供給某個或某群消費者的產品或服務,并使之與競爭對手的產品或服務相區別。比如,汽車品牌“先代”、“敖滴”、“喔哦喔”等。
傳統的品牌識別主要方式有基于規則的方法和基于機器學習的方法。基于規則的方法單純依賴于品牌詞典,需要大量的人工收集工作,并且很難消除歧義,品牌識別準確率和召回率較差;基于機器學習的方法,需要大量的人工標注語料,費時費力,品牌識別效率較低。
發明內容
本發明實施例提供一種品牌詞識別方法、裝置、設備及存儲介質,能夠提高品牌識別的準確率、召回率和效率。
一方面,本發明實施例提供了一種品牌詞識別方法,方法包括:
選擇第一產品對象的描述信息;
確定描述信息所屬類目;
對描述信息進行分詞處理,得到描述信息對應的關鍵字集合;
從關鍵字集合中確定目標關鍵字;
確定目標關鍵字對應的類目;
若描述信息所屬類目與目標關鍵字對應的類目一致,則識別目標關鍵字為品牌詞。
在本發明的一個實施例中,確定描述信息所屬類目,包括:
利用預設用于確定類目的分類器,確定描述信息所屬類目。
在本發明的一個實施例中,從關鍵字集合中確定目標關鍵字,包括:
確定關鍵字集合中的一個或多個關鍵字分別所對應的詞向量;
將詞向量與預設品牌詞向量集合中的品牌詞向量的相似度最高的關鍵字,確定為目標關鍵字。
在本發明的一個實施例中,確定目標關鍵字對應的類目,包括:
根據預設品牌詞向量集合中的品牌詞向量與類目的對應關系,確定目標關鍵字對應的類目。
在本發明的一個實施例中,根據預設品牌詞向量集合中的品牌詞向量與類目的對應關系,確定目標關鍵字對應的類目,包括:
將預設品牌詞向量集合中與目標關鍵字對應的詞向量相似度最高的品牌詞向量對應的類目,確定為目標關鍵字對應的類目。
在本發明的一個實施例中,方法還包括:
從關鍵字集合中確定一個或多個候選品牌詞;
針對每一個候選品牌詞,檢測關鍵字集合中是否存在與候選品牌詞具有對應關系的關鍵字;
若關鍵字集合中存在與候選品牌詞具有對應關系的關鍵字,識別候選品牌詞為品牌詞。
在本發明的一個實施例中,方法還包括:
若關鍵字集合中不存在與候選品牌詞具有對應關系的關鍵字,則確定候選品牌詞對應的多個組合詞;
針對每個組合詞,計算組合詞對應的詞向量與關鍵字集合的相似度;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810723842.8/2.html,轉載請聲明來源鉆瓜專利網。





