[發明專利]文本分類方法、裝置、存儲介質及設備有效
| 申請號: | 202010159121.6 | 申請日: | 2020-03-09 |
| 公開(公告)號: | CN111444709B | 公開(公告)日: | 2022-08-12 |
| 發明(設計)人: | 劉巍 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F40/279 | 分類號: | G06F40/279;G06F40/295;G06F40/30 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 祝亞男 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 分類 方法 裝置 存儲 介質 設備 | ||
本申請公開了一種文本分類方法、裝置、存儲介質及設備,屬于人工智能技術領域。包括:獲取待處理文本;調用情感分析模型中的目標語言模型對待處理文本進行編碼處理,得到特征向量序列,目標語言模型為BERT模型,特征向量序列表征了待處理文本中詞之間的上下文關系;對確定的目標詞進行向量化處理得到目標特征向量;對特征向量序列和目標特征向量進行第一特征融合處理,根據得到的第一特征向量和特征向量序列獲取第二特征向量;對第二特征向量和目標特征向量進行第二特征融合處理;基于得到的第三特征向量,預測目標詞在待處理文本中的情感極性。本申請能夠準確預測目標詞在文本中的情感極性,即可實現在文本中精準地對目標詞進行情感分類。
技術領域
本申請涉及人工智能技術領域,特別涉及一種文本分類方法、裝置、存儲介質及設備。
背景技術
對文本進行情感分析(Sentiment Analysis,SA),是人工智能技術領域中一種典型的自然語言處理(Natural Language Processing,NLP)任務,目前具有廣泛的應用場景。
情感分析也可稱之為意見挖掘或傾向性分析,用于分析人們的觀點或情緒,以評估用戶對諸如產品或服務等實體的情感趨向。示例性地,用戶在對指定產品發表文本評價之后,可通過對該文本評價進行情感分析來確定其情感極性(比如積極、消極或中立),從而確定用戶對該指定產品的情感趨向,比如用戶是否喜愛該指定產品。
目標情感分析(Targeted Sentiment Analysis,TSA)是情感分析的一個分支,旨在分析目標詞在文本中的情感極性。例如,給定一個文本和目標詞(比如服務或口味等),確定目標詞在該文本中的情感分類。其中,準確預測目標詞在文本中的情感極性至關重要,是衡量一個情感分析方案的重要指標。為此,如何進行文本分類,便成為了時下本領域技術人員亟待解決的一個問題。
發明內容
本申請實施例提供了一種文本分類方法、裝置、存儲介質及設備,能夠準確地預測目標詞在文本中的情感極性,即可實現在文本中精準地對目標詞進行情感分類。所述技術方案如下:
一方面,提供了一種文本分類方法,所述方法包括:
獲取待處理文本;
調用情感分析模型中的目標語言模型對所述待處理文本進行編碼處理,得到特征向量序列,所述目標語言模型為BERT(Bidirectional Encoder Representat- ions fromTransformers,基于變換器的雙向編碼表征)模型,所述特征向量序列表征了所述待處理文本中詞之間的上下文關系;
對確定的目標詞進行向量化處理得到目標特征向量;
對所述特征向量序列和所述目標特征向量進行第一特征融合處理,根據得到的第一特征向量和所述特征向量序列獲取第二特征向量;
對所述第二特征向量和所述目標特征向量進行第二特征融合處理;基于得到的第三特征向量,預測所述目標詞在所述待處理文本中的情感極性。
另一方面,提供了一種文本分類裝置,所述裝置包括:
獲取模塊,用于獲取待處理文本;
第一處理模塊,用于調用情感分析模型中的目標語言模型對所述待處理文本進行編碼處理,得到特征向量序列,所述目標語言模型為BERT模型,所述特征向量序列表征了所述待處理文本中詞之間的上下文關系;
第二處理模塊,用于對確定的目標詞進行向量化處理得到目標特征向量;
第三處理模塊,用于對所述特征向量序列和所述目標特征向量進行第一特征融合處理;根據得到的第一特征向量和所述特征向量序列獲取第二特征向量;對所述第二特征向量和所述目標特征向量進行第二特征融合處理;
預測模塊,用于基于得到的第三特征向量,預測所述目標詞在所述待處理文本中的情感極性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010159121.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種處理方法及裝置
- 下一篇:一種隨機接入定時提前量指示方法和設備





