[發明專利]評價關系的生成方法及相關裝置有效
| 申請號: | 201711046157.8 | 申請日: | 2017-10-31 |
| 公開(公告)號: | CN109726384B | 公開(公告)日: | 2023-08-25 |
| 發明(設計)人: | 韓旭紅 | 申請(專利權)人: | 北京國雙科技有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/289 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 李慧引;王寶筠 |
| 地址: | 100080 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 評價 關系 生成 方法 相關 裝置 | ||
本發明公開了一種評價關系的生成方法及相關裝置,該評價關系的生成方法,包括:將評價文本中的評價信息標注上對應的標簽,得到標簽序列;對于標簽序列中每一個被標注為第一標簽的評價信息,判斷該評價信息在第一詞序列中被標記為評價對象的概率是否大于閾值;其中,第一標簽用于表明評價信息為無含義的詞語;第一詞序列包括:被標注為第一標簽的評價信息、以及被標注為第一標簽的評價信息在標簽序列中的前后n個評價信息,n為自然數;若是,則調整相應評價信息對應的標簽為第二標簽;其中,第二標簽用于表明評價信息為評價對象;依據標簽間的搭配關系,建立調整標簽后的標簽序列中評價信息間的評價關系。
技術領域
本發明涉及信息處理技術領域,尤其涉及一種評價關系的生成方法及相關裝置。
背景技術
隨著互聯網的快速發展,越來越多的人會在網上發表自身對人、事或者物的評價。網絡上會出現大量含有個人觀點的評價文本。因此,如何解析評價文件,構建出評價文件中評價信息間的評價關系,是信息處理領域的一個研究熱點。
目前,在得到評價關系的過程中,需要先抽取評價文本中的評價信息,并對其進行標注。主要采用序列標注算法,例如:HMM(隱馬爾可夫模型,英文:Hidden?Markov?Model)、CRF(條件隨機場算法,英文:conditional?random?field?algorithm)、RNN(多層反饋網絡,英文:RecurrentNeural?Network)等。
但是,受評價信息所使用的自然語言的語言表達的復雜性、序列標注算法中所采用的標注模型的訓練數據標注質量問題以及訓練特征不均衡等的影響,會導致評價文本中的屬于評價對象的評價信息無法被完全抽取,影響評價關系的完整構建。
發明內容
鑒于上述問題,提出了本發明以便提供一種克服上述問題或者至少部分地解決上述問題的評價關系的生成方法及相關裝置。
一種評價關系的生成方法,包括:
將評價文本中的評價信息標注上對應的標簽,得到標簽序列;
對于所述標簽序列中每一個被標注為第一標簽的評價信息,判斷該評價信息在第一詞序列中被標記為評價對象的概率是否大于閾值;其中,所述第一標簽用于表明評價信息為無含義的詞語;所述第一詞序列包括:所述被標注為第一標簽的評價信息、以及所述被標注為第一標簽的評價信息在所述標簽序列中的前后n個評價信息,n為自然數;
若是,則調整相應評價信息對應的標簽為第二標簽;其中,所述第二標簽用于表明評價信息為評價對象;
依據標簽間的搭配關系,建立調整標簽后的所述標簽序列中評價信息間的評價關系。
可選地,所述將評價文本中的評價信息標注上對應的標簽,得到標簽序列,包括:
對所述評價文本進行分詞處理,得到所述評價文本包括的評價信息;
識別所述評價信息的屬性特征,確定所述評價信息的屬性特征對應的標簽;
為所述評價文本包括的評價信息分別添加其屬性特征對應的標簽,得到所述標簽序列。
可選地,所述評價關系的生成方法還包括:
對于所述標簽序列中每一個被標注為所述第二標簽的評價信息,判斷該評價信息的第二詞序列中是否存在概率大于閾值的情感詞;其中,所述第二詞序列包括:所述被標注為第二標簽的評價信息、以及所述被標注為第二標簽在所述標簽序列中的前后n個評價信息,n為自然數;
若是,則調整所述情感詞對應標簽為第三標簽;其中,所述第三標簽用于表明評價信息屬于評價對象的情感詞。
可選地,所述評價關系的生成方法還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京國雙科技有限公司,未經北京國雙科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711046157.8/2.html,轉載請聲明來源鉆瓜專利網。





