[發明專利]基于本體詞庫的商品評論屬性詞抽取方法有效
| 申請號: | 201510138316.1 | 申請日: | 2015-03-26 |
| 公開(公告)號: | CN104715049B | 公開(公告)日: | 2017-11-28 |
| 發明(設計)人: | 馬睿;周曉鋒;潘福成 | 申請(專利權)人: | 無錫中科泛在信息技術研發中心有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 無錫市大為專利商標事務所(普通合伙)32104 | 代理人: | 殷紅梅,劉品超 |
| 地址: | 214135 江蘇省無錫市新*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 本體 詞庫 商品 評論 屬性 抽取 方法 | ||
1.一種基于本體詞庫的商品評論屬性詞抽取方法,其特征在于,包括下述步驟:
步驟1,對評論文本預處理:首先將每條評論文本分割為不同的子句;其次,對每條評論的各個子句,結合屬性詞本體詞庫,進行分詞,然后進行詞性標注,去停用詞,接著在子句中搜索名詞作為該條評論的屬性詞候選集;
步驟2,對屬性詞候選集中的屬性詞進行歸類:對具體一種商品,遍歷與這種商品相關的所有商品評論的屬性詞候選集,各自對每個屬性詞候選集中的屬性詞進行歸類操作;歸類后,對每個屬性詞候選集,會生成若干同義詞類,每個同義詞類是屬性詞本體詞庫中某個對應的同義詞類的子集;
步驟3,在各個屬性詞候選集中,合并屬性詞的同義詞類;
步驟4,經過對屬性詞候選集中的合并操作之后,將每個同義詞類的中心詞認定為屬性詞候選集對應的子句的屬性詞;
步驟2中,對屬性詞候選集中的屬性詞進行歸類操作的方法為:查找屬性詞本體詞庫,獲取并返回詞語w所在同義詞類的中心詞W;將中心詞W代表的同義詞類確定為詞語w的同義詞類;
步驟3中,合并的方法為:屬性詞候選集中,
如果兩個同義詞類A和B的中心詞是屬性詞本體詞庫中處于同一層次的詞,且具有相同的上一層詞語,且同義詞類A和B內的詞語數量都小于設定閾值,則將同義詞類A和B合并,合并后新的同義詞類的中心詞是同義詞類A和B的中心詞在屬性詞本體詞庫中上一層的詞語;
如果兩個同義詞類A和B的中心詞在屬性詞本體詞庫的層次關系上是從屬關系,且同義詞類A和B內的詞語數量都小于設定閾值,則將同義詞類A和B合并,合并后新的同義詞類的中心詞是同義詞類A和B的中心詞在屬性詞本體詞庫的層次關系上位于從屬關系上層的中心詞。
2.如權利要求1所述的基于本體詞庫的商品評論屬性詞抽取方法,其特征在于:
步驟1中,具體采用正向最大匹配方法進行分詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于無錫中科泛在信息技術研發中心有限公司,未經無錫中科泛在信息技術研發中心有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510138316.1/1.html,轉載請聲明來源鉆瓜專利網。





