[發明專利]一種知識圖譜完善方法和裝置有效
| 申請號: | 201710833203.2 | 申請日: | 2017-09-15 |
| 公開(公告)號: | CN107748754B | 公開(公告)日: | 2021-10-26 |
| 發明(設計)人: | 徐然;崔燕紅;張智祺;黃惠燕;郭安琪 | 申請(專利權)人: | 廣州唯品會研究院有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06Q30/06 |
| 代理公司: | 北京市萬慧達律師事務所 11111 | 代理人: | 王虎 |
| 地址: | 510000 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 知識 圖譜 完善 方法 裝置 | ||
1.一種知識圖譜完善方法,其特征在于,所述方法包括:
從至少包含商品圖片和商品的文本描述信息的商品信息中提取商品的標簽,包括:提取所述商品圖片中的圖像特征,以及從文本描述信息中抽取有效文本,對有效文本進行中文分詞和詞性標注,利用LDA模型或PLSA模型對文本進行聚類,利用TF-LDF算法或TextRank算法抽取聚類后的文本中的關鍵詞,根據所述圖像特征和所述關鍵詞,確定所述商品的標簽,其中,所述文本描述信息包括所述商品的標題信息、所述商品的網頁信息和所述商品的評論信息中的至少一種;
將提取到的所述標簽添加至知識圖譜,所述知識圖譜包括商品知識圖譜和/或用戶知識圖譜;
在所述知識圖譜中設置與提取到的所述標簽相對應的關系。
2.根據權利要求1所述的方法,其特征在于,
所述將提取到的所述標簽添加至知識圖譜包括:
確定提取到的所述標簽對應的標簽類別;
根據所述標簽類別,將提取到的所述標簽添加至所述知識圖譜;
所述在所述知識圖譜中設置與提取到的所述標簽相對應的關系包括:
在所述商品知識圖譜中設置提取到的所述標簽與所述商品之間的關系;
在所述用戶知識圖譜中匹配提取到的所述標簽與其他標簽之間的關系;以及
在所述用戶知識圖譜中更新提取到的所述標簽與其他標簽之間的關系。
3.根據權利要求1所述的方法,其特征在于,
所述將提取到的所述標簽添加至知識圖譜包括:
將提取到的所述標簽添加至標簽庫;
定義提取到的所述標簽所屬的標簽類別;
根據所述標簽類別,將提取到的所述標簽添加至所述知識圖譜;
所述在所述知識圖譜中設置與提取到的所述標簽相對應的關系包括:
在所述商品知識圖譜中設置提取到的所述標簽與所述商品之間的關系;
在所述用戶知識圖譜中更新提取到的所述標簽與其他標簽之間的關系。
4.一種知識圖譜完善裝置,其特征在于,所述裝置包括:
提取模塊,用于從至少包含商品圖片和商品的文本描述信息的商品信息中提取商品的標簽,包括:提取所述商品圖片中的圖像特征,以及從文本描述信息中抽取有效文本,對有效文本進行中文分詞和詞性標注,利用LDA模型或PLSA模型對文本進行聚類,利用TF-LDF算法或TextRank算法抽取聚類后的文本中的關鍵詞,根據所述圖像特征和所述關鍵詞,確定所述商品的標簽,其中,所述文本描述信息包括所述商品的標題信息、所述商品的網頁信息和所述商品的評論信息中的至少一種;添加模塊,用于將提取到的所述標簽添加至知識圖譜,所述知識圖譜包括商品知識圖譜和/或用戶知識圖譜;
設置模塊,用于在所述知識圖譜中設置與提取到的所述標簽相對應的關系。
5.根據權利要求4所述的裝置,其特征在于,
所述添加模塊具體用于:
確定提取到的所述標簽對應的標簽類別;
根據所述標簽類別,將提取到的所述標簽添加至所述知識圖譜;
所述設置模塊具體用于:
在所述商品知識圖譜中設置提取到的所述標簽與所述商品之間的關系;
在所述用戶知識圖譜中匹配提取到的所述標簽與其他標簽之間的關系;以及
在所述用戶知識圖譜中更新提取到的所述標簽與其他標簽之間的關系。
6.根據權利要求4所述的裝置,其特征在于,
所述添加模塊具體還用于:
將所述標簽添加至所述標簽庫;
定義所述標簽所屬的標簽類別;
根據所述標簽類別,將提取到的所述標簽添加至所述知識圖譜;
所述設置模塊具體還用于:
在所述商品知識圖譜中設置提取到的所述標簽與所述商品之間的關系;
在所述用戶知識圖譜中更新提取到的所述標簽與其他標簽之間的關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州唯品會研究院有限公司,未經廣州唯品會研究院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710833203.2/1.html,轉載請聲明來源鉆瓜專利網。





