[發明專利]一種中文商標相似度計算方法在審
| 申請號: | 202110790797.X | 申請日: | 2021-07-13 |
| 公開(公告)號: | CN113468885A | 公開(公告)日: | 2021-10-01 |
| 發明(設計)人: | 李學俊;高仕錦;廖偉偉 | 申請(專利權)人: | 安徽大學綠色產業創新研究院 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/216 |
| 代理公司: | 合肥天明專利事務所(普通合伙) 34115 | 代理人: | 閆客 |
| 地址: | 230088 安徽省合肥*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 中文 商標 相似 計算方法 | ||
1.一種中文商標相似度計算方法,其特征在于,包括:
獲取待比較的第一商標和第二商標的名稱,并對第一商標名稱和第二商標名稱進行分詞處理,分別得到第一分詞列表和第二分詞列表;
對兩個分詞列表中的詞語兩兩組合計算詞林詞語相似度、知網詞語相似度以及Word2Vec詞語相似度;
采用動態加權策略分別計算第一分詞列表中的各個詞語與第二分詞列表中的每個詞語的詞林詞語相似度、知網詞語相似度及Word2Vec詞語相似度的綜合相似度作為第一分詞列表中各個詞語對應的詞語相似度組,取各個詞語對應的詞語相似度組中的最大值作為當前詞語的局部相似度,將第一分詞列表中的所有詞語的局部相似度組成第一局部相似度列表;
采用動態加權策略分別計算第二分詞列表中的各個詞語與第一分詞列表中的每個詞語的詞林詞語相似度、知網詞語相似度及Word2Vec詞語相似度的綜合相似度作為第二分詞列表中各個詞語對應的詞語相似度組,取各個詞語對應的詞語相似度組中的最大值作為當前詞語的局部相似度,將第二分詞列表中的所有詞語的局部相似度組成第二局部相似度列表;
根據第一局部相似度列表和第二局部相似度列表,計算第一商標的名稱和第二商標的名稱的含義相似度。
2.如權利要求1所述的中文商標相似度計算方法,其特征在于,所述第一分詞列表中的第r個詞語War與所述第二分詞列表中的第m個詞語Wbm之間的詞林詞語相似度SimCilin(War,Wbm)的計算步驟包括:
利用《同義詞林擴展版》詞典文件cilinFile構建商標詞林同義詞庫traCilinFile;
根據商標詞林同義詞庫traCilinFile將詞語War與詞語Wbm轉為詞林編碼,并獲取詞語War與詞語Wbm對應的所有詞林編碼的組合;
基于所有詞林編碼的組合,判斷組合中是否存在詞林編碼相等的情況;
若存在,則讀取當前編碼所在行的詞群,并判斷詞語War與詞語Wbm是否構成相似,若不近似,則記SimCilin(War,Wbm)=0,若近似,則記SimCilin(War,Wbm)=1;
若不存在,采用基于信息內容的詞林相似度計算方法計算所有詞林編碼組合的相似度,取最大值作為SimCilin(War,Wbm)。
3.如權利要求2所述的中文商標相似度計算方法,其特征在于,所述利用《同義詞林擴展版》詞典文件cilinFile構建商標詞林同義詞庫traCilinFile,包括:
將所述《同義詞林擴展版》詞典文件cilinFile中詞林編碼相同的同一行的詞語互不相似的標記為數字0;
將所述《同義詞林擴展版》詞典文件cilinFile中詞林編碼相同的同一行的詞語互為相似的標記為同一種非0數字,構建得到所述商標詞林同義詞庫traCilinFile。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽大學綠色產業創新研究院,未經安徽大學綠色產業創新研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110790797.X/1.html,轉載請聲明來源鉆瓜專利網。





