[發(fā)明專利]一種產品屬性的分析方法和裝置有效
| 申請?zhí)枺?/td> | 201710905862.2 | 申請日: | 2017-09-29 |
| 公開(公告)號: | CN110019831B | 公開(公告)日: | 2021-09-07 |
| 發(fā)明(設計)人: | 王天祎 | 申請(專利權)人: | 北京國雙科技有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F40/284;G06N3/08 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 劉志紅;王寶筠 |
| 地址: | 100080 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 產品 屬性 分析 方法 裝置 | ||
1.一種產品屬性的分析方法,其特征在于,包括:
接收預測文本內容;
生成所述預測文本內容的切詞序列;
確定所述切詞序列中切詞的詞向量以及所述切詞序列的屬性向量;
基于所述切詞的詞向量和所述切詞序列的屬性向量生成所述預測文本內容的矩陣塊;
將所述預測文本內容的矩陣塊輸入到預先訓練的神經網絡模型中,輸出所述預測文本內容的切詞序列的標簽;其中,所述神經網絡模型為基于訓練文件內容的切詞序列建立的數(shù)據(jù)集合以及所述訓練文件內容的切詞序列的標簽訓練得到的模型;采用標簽對切詞序列進行標注包括:將屬性詞的起始詞采用第一標簽標注,將屬性詞的其余部分采用第二標簽標注,將評價詞的起始詞采用第三標簽標注,將評價詞的其余部分采用第四標簽標注;所述第一標簽、所述第二標簽、所述第三標簽和所述第四標簽不同;
對所述切詞序列的標簽進行拼接,生成預測結果;其中,對所述切詞序列的標簽進行拼接包括:將相鄰的第一標簽和第二標簽拼接成一個屬性詞,將相鄰的第三標簽和第四標簽拼接成一個評價詞。
2.根據(jù)權利要求1所述的方法,其特征在于,所述接收預測文件內容之前,還包括:
獲取訓練語料中的訓練文本內容,生成所述訓練文本內容的切詞序列;
確定所述切詞序列中切詞的詞向量以及所述切詞序列的屬性向量;
基于所述切詞的詞向量和所述切詞序列的屬性向量生成所述訓練文本內容的矩陣塊;
基于所述訓練文本內容的矩陣塊建立所述訓練語料的數(shù)據(jù)集合;
基于所述數(shù)據(jù)集合以及所述訓練文本內容的切詞序列的標簽訓練所述神經網絡模型。
3.根據(jù)權利要求1或2所述的方法,其特征在于,確定所述切詞序列的屬性向量,包括:
標注所述切詞序列的詞性,和/或,所述切詞序列的依存句法序列;
對所述切詞序列的詞性進行編碼生成詞性向量,和/或,對所述切詞序列的依存句法序列進行編碼生成依存句法序列向量;
其中,所述屬性向量包括所述詞性向量,和/或,所述依存句法序列向量。
4.根據(jù)權利要求1或2所述的方法,其特征在于,確定所述切詞序列中切詞的詞向量,包括:
查找預先建立的詞向量模型中是否包含所述切詞的詞向量;
若包含,確定所述切詞在所述詞向量模型中的詞向量;
若不包含,隨機生成與所述詞向量模型等維度的所述切詞的詞向量。
5.根據(jù)權利要求2所述的方法,其特征在于,所述獲取訓練語料中的訓練文本內容,生成所述訓練文本內容的切詞序列之前,還包括:
獲取目標語料庫中的目標文本內容;
基于預先設定的詞向量模型對所述目標文本內容進行訓練,生成詞向量模型。
6.一種產品屬性的分析裝置,其特征在于,包括:
接收內容單元,用于接收預測文本內容;
生成序列單元,用于生成所述預測文本內容的切詞序列;
第一詞向量單元,用于確定所述切詞序列中切詞的詞向量;
第一屬性向量單元,用于確定所述切詞序列的屬性向量;
第一矩陣單元,用于基于所述切詞的詞向量和所述切詞序列的屬性向量生成所述預測文本內容的矩陣塊;
輸出標簽單元,用于將所述預測文本內容的矩陣塊輸入到預先訓練的神經網絡模型中,輸出所述預測文本內容的切詞序列的標簽;其中,所述神經網絡模型為基于訓練文件內容的切詞序列建立的數(shù)據(jù)集合以及所述訓練文件內容的切詞序列的標簽訓練得到的模型;采用標簽對切詞序列進行標注包括:將屬性詞的起始詞采用第一標簽標注,將屬性詞的其余部分采用第二標簽標注,將評價詞的起始詞采用第三標簽標注,將評價詞的其余部分采用第四標簽標注;所述第一標簽、所述第二標簽、所述第三標簽和所述第四標簽不同;
生成結果單元,用于對所述切詞序列的標簽進行拼接,生成預測結果;其中,對所述切詞序列的標簽進行拼接包括:將相鄰的第一標簽和第二標簽拼接成一個屬性詞,將相鄰的第三標簽和第四標簽拼接成一個評價詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京國雙科技有限公司,未經北京國雙科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710905862.2/1.html,轉載請聲明來源鉆瓜專利網。





