[發明專利]文本信息處理方法、裝置、存儲介質及電子設備在審
| 申請號: | 202010286959.1 | 申請日: | 2020-04-13 |
| 公開(公告)號: | CN111539212A | 公開(公告)日: | 2020-08-14 |
| 發明(設計)人: | 劉澍;劉智靜;周宇超;康斌 | 申請(專利權)人: | 騰訊科技(武漢)有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06K9/00;G06F16/33;G06F16/35;G10L15/26 |
| 代理公司: | 深圳翼盛智成知識產權事務所(普通合伙) 44300 | 代理人: | 蔡艾瑩 |
| 地址: | 430000 湖北省武*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 信息處理 方法 裝置 存儲 介質 電子設備 | ||
本申請實施例公開了一種文本信息處理方法、裝置、存儲介質及電子設備。文本信息處理方法包括:當文本信息存在情感詞時,按照預設規則對文本信息中的情感詞進行量化處理,并根據量化處理結果確定文本信息的目標情感類別;當文本信息中不存在情感詞時,檢測文本信息的文本長度;若文本長度小于或等于預設值,則根據文本信息的句向量確定其對應屬于多個不同樣本情感類別的概率,并根據概率從多個不同樣本情感類別中確定文本信息的目標情感類別;若文本長度大于預設值,則根據文本信息指定類型的嵌入向量確定文本信息的目標情感類別。本方案中,按照計算復雜程度從易到難的邏輯架構對文本信息進行處理,提升了文本信息的處理速度和處理效果。
技術領域
本申請涉及信息處理技術領域,具體涉及一種文本信息處理方法、裝置、存儲介質及電子設備。
背景技術
隨著互聯網的發展和移動通信網絡的發展,同時也伴隨著電子設備的處理能力和存儲能力的迅猛發展,海量的應用程序得到了迅速傳播和使用,尤其是可供用戶發表文本、圖片、聲音或視頻等媒體信息的應用。
文本情感分析又稱意見挖掘、傾向性分析等,具體為對帶有情感色彩的主觀性文本進行分析、處理、歸納和推理的過程。互聯網上產生了大量的用戶參與的、對于諸如人物、事件、產品等有價值的評論信息。這些評論信息表達了人們的各種情感色彩和情感傾向性,如喜、怒、哀、樂和批評、贊揚等。因此,通過對這些媒體信息進行情感分析,其分析結果可以為信息審核、用戶畫像刻畫、內容推薦等應用場景下的決策提供較高的參考價值。
發明內容
本申請實施例提供一種文本信息處理方法、裝置、存儲介質及電子設備,可以提升文本信息的處理速度和處理效果。
本申請實施例提供了一種文本信息處理方法,包括:
獲取待處理的文本信息;
當所述文本信息存在情感詞時,按照預設規則對所述文本信息中的情感詞進行量化處理,并根據量化處理結果確定所述文本信息的目標情感類別;
當所述文本信息中不存在情感詞時,檢測所述文本信息的文本長度;
若所述文本長度小于或等于預設值,則根據所述文本信息的句向量確定其對應屬于多個不同樣本情感類別的概率,并根據所述概率從多個不同樣本情感類別中確定所述文本信息的目標情感類別;
若所述文本長度大于所述預設值,則根據所述文本信息指定類型的嵌入向量確定所述文本信息的目標情感類別,其中,不同類型的嵌入向量基于所述文本信息在不同維度上的特征及特征間的相關性得到。
相應的,本申請實施例還提供了一種文本信息處理裝置,包括:
獲取單元,用于獲取待處理的文本信息;
第一確定單元,用于當候選文本集合中存在與所述文本信息匹配的目標候選文本時,將所述目標候選文本對應的情感類別確定為所述文本信息的目標情感類別;
長度檢測單元,用于當候選文本集合中不存在與所述文本信息匹配的目標候選文本時,檢測所述文本信息的文本長度;
第二確定單元,用于若所述文本長度小于或等于預設值,則根據所述文本信息的句向量確定其對應屬于多個不同樣本情感類別的概率,并根據所述概率從多個不同樣本情感類別中確定所述文本信息的目標情感類別;
第三確定單元,用于若所述文本長度大于所述預設值,則根據所述文本信息指定類型的嵌入向量確定所述文本信息的目標情感類別,其中,不同類型的嵌入向量基于所述文本信息在不同維度上的特征及特征間的相關性得到。
相應的,本申請實施例還提供了一種計算機可讀存儲介質,所述存儲介質存儲有多條指令,所述指令適于處理器進行加載,以執行如上所述的文本信息處理方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(武漢)有限公司,未經騰訊科技(武漢)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010286959.1/2.html,轉載請聲明來源鉆瓜專利網。





