[發明專利]一種基于機器識別的線上商品專利獲取方法及系統有效
| 申請號: | 201810123776.0 | 申請日: | 2018-02-07 |
| 公開(公告)號: | CN108984577B | 公開(公告)日: | 2023-06-06 |
| 發明(設計)人: | 李遠新 | 申請(專利權)人: | 廣州集創佳禾知識產權運營有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/58;G06F16/583;G06V10/44;G06V10/56;G06V10/74;G06Q50/18 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 張春水;唐京橋 |
| 地址: | 510623 廣東省廣州市廣州高新技術產*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 機器 識別 線上 商品 專利 獲取 方法 系統 | ||
1.一種基于機器識別的線上商品專利獲取方法,其特征在于,包括:
獲取用戶提供的購物網頁,并采用網頁爬蟲爬取所述購物網頁的商品標題和商品圖片;
將所述商品標題與預設的品牌詞庫及預設的商品名稱詞庫進行匹配,獲得品牌名稱及商品名稱;
將所述商品的品牌名稱作為申請人關鍵詞并將所述商品的名稱作為檢索關鍵詞,在預置專利數據庫中進行組合檢索,獲得對應的第一檢索結果;
根據所述商品名稱選取對應的圖像庫,采用所述圖像庫并基于顏色特征提取的卷積神經網絡對所述商品信息圖像進行匹配,獲得所述圖像庫中與所述商品信息圖像中的主體目標相似度最高的模板圖像;
根據所述模板圖像的輪廓特征,結合canny算子和形態學運算對所述商品信息圖像中的主體目標進行邊緣輪廓提取,獲得所述主體目標的輪廓圖像;
提取所述輪廓圖像的特征,并基于所述輪廓圖像的特征對所述第一檢索結果中的附圖進行特征匹配,獲得與所述輪廓圖像匹配的附圖及對應的專利文獻;
根據所述模板圖像的輪廓特征,所述結合canny算子和形態學運算對所述商品信息圖像中的主體目標進行邊緣輪廓提取包括:
采用canny算子對所述主體目標進行整體輪廓提取,并通過形態學運算提取所述主體目標的內部邊緣;
所述采用所述圖像庫并基于顏色特征提取的卷積神經網絡對所述商品信息圖像進行匹配包括:
對所述商品信息圖像的顏色直方向量進行歸一化處理,獲得歸一化顏色矩向量;
對所述顏色直方向量以及所述歸一化顏色矩向量進行賦權拼接,獲得顏色特征向量;
將所述顏色特征向量輸入卷積神經網絡獲得圖像特征向量后與所述圖像庫中的圖像進行匹配。
2.根據權利要求1所述的基于機器識別的線上商品專利獲取方法,其特征在于,所述結合canny算子和形態學運算對所述商品信息圖像中的主體目標進行邊緣輪廓提取之后還包括:
根據所述模板圖像的輪廓特征,對所述主體目標的輪廓圖像中的缺陷部分進行邊緣輪廓修復。
3.根據權利要求1所述的基于機器識別的線上商品專利獲取方法,其特征在于,所述提取所述輪廓圖像的特征,并基于所述輪廓圖像的特征對所述第一檢索結果中的附圖進行特征匹配包括:
提取所述輪廓圖像的特征點和輪廓中心點,并采用所述特征點和輪廓中心點建立相似矩陣;
對所述輪廓圖像上的像素點均進行相似矩陣的計算,獲得所述輪廓圖像的特征組合;
將所述特征組合與所述第一檢索結果中的附圖的特征進行特征匹配;
所述第一檢索結果中的附圖的特征的獲取方法與所述輪廓圖像的特征組合獲取方法一致。
4.根據權利要求1所述的基于機器識別的線上商品專利獲取方法,其特征在于,在獲得商品的名稱之后還包括:
在預設的專業術語詞庫中檢索是否存在與所述商品的名稱匹配的專業術語,若是,則將所述商品的品牌名稱作為申請人關鍵詞并將所述專業術語作為檢索關鍵詞,在預置專利數據庫中進行組合檢索,獲得對應的第一檢索結果。
5.根據權利要求1所述的基于機器識別的線上商品專利獲取方法,其特征在于,還包括:
獲取所述購物網頁的源代碼,并通過預設的正則表達式檢索特定標簽下包裹的內容,獲得商品的特征詞;
將所述特征詞作為檢索關鍵詞在所述第一檢索結果中進行二次檢索,獲得第二檢索結果。
6.根據權利要求1所述的基于機器識別的線上商品專利獲取方法,其特征在于,還包括:
對所述商品圖片進行字符識別;
根據進行字符識別獲得的文字,生成商品描述文;
對所述商品描述文進行高頻詞摘取,并將摘取獲得的高頻詞作為檢索關鍵詞在所述第一檢索結果中進行二次檢索,獲得第三檢索結果。
7.根據權利要求6所述的基于機器識別的線上商品專利獲取方法,其特征在于,所述對所述商品描述文進行高頻詞摘取具體包括:
根據所述商品描述文中的每個詞語在圖片中的大小比例,賦予所述每個詞語對應的權重;
將所述商品描述文中所有的詞語的權重進行疊加,獲得權重值最高的詞語,并將所述權重值最高的詞語作為高頻詞。
8.一種基于機器識別的線上商品專利獲取系統,其特征在于,包括:
獲取模塊,用于獲取用戶提供的購物網頁,并采用網頁爬蟲爬取所述購物網頁的商品標題和商品圖片;
匹配模塊,用于將所述商品標題與預設的品牌詞庫及預設的商品名稱詞庫進行匹配,獲得品牌名稱及商品名稱;
檢索模塊,用于將所述商品的品牌名稱作為申請人關鍵詞并將所述商品的名稱作為檢索關鍵詞,在預置專利數據庫中進行組合檢索,獲得對應的第一檢索結果;
圖像匹配模塊,用于根據所述商品名稱選取對應的圖像庫,采用所述圖像庫并基于顏色特征提取的卷積神經網絡對所述商品信息圖像進行匹配,獲得所述圖像庫中與所述商品信息圖像中的主體目標相似度最高的模板圖像;
輪廓提取模塊,用于根據所述模板圖像的輪廓特征,結合canny算子和形態學運算對所述商品信息圖像中的主體目標進行邊緣輪廓提取,獲得所述主體目標的輪廓圖像;
特征匹配模塊,用于提取所述輪廓圖像的特征,并基于所述輪廓圖像的特征對所述第一檢索結果中的附圖進行特征匹配,獲得與所述輪廓圖像匹配的附圖及對應的專利文獻;
根據所述模板圖像的輪廓特征,所述結合canny算子和形態學運算對所述商品信息圖像中的主體目標進行邊緣輪廓提取包括:
采用canny算子對所述主體目標進行整體輪廓提取,并通過形態學運算提取所述主體目標的內部邊緣;
所述采用所述圖像庫并基于顏色特征提取的卷積神經網絡對所述商品信息圖像進行匹配包括:
對所述商品信息圖像的顏色直方向量進行歸一化處理,獲得歸一化顏色矩向量;
對所述顏色直方向量以及所述歸一化顏色矩向量進行賦權拼接,獲得顏色特征向量;
將所述顏色特征向量輸入卷積神經網絡獲得圖像特征向量后與所述圖像庫中的圖像進行匹配。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州集創佳禾知識產權運營有限公司,未經廣州集創佳禾知識產權運營有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810123776.0/1.html,轉載請聲明來源鉆瓜專利網。





