[發明專利]一種基于貼圖表情的情感檢測方法以及系統有效
| 申請號: | 201711407785.4 | 申請日: | 2017-12-22 |
| 公開(公告)號: | CN108052982B | 公開(公告)日: | 2021-09-03 |
| 發明(設計)人: | 陳雷;張桐 | 申請(專利權)人: | 深圳市云網拜特科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/08;G06F40/151 |
| 代理公司: | 深圳市順天達專利商標代理有限公司 44217 | 代理人: | 李琴 |
| 地址: | 518000 廣東省深圳市前海深港合作區前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 貼圖 表情 情感 檢測 方法 以及 系統 | ||
本發明公開了一種基于貼圖表情的情感檢測方法以及系統,方法包括:采集帶有貼圖表情的文本數據;對所采集來的數據進行預處理,轉換為詞向量數據集;將數據預處理單元生成的數據集輸入一個已經訓練好的網絡模型,該網絡模型輸出相應的情感檢測結果。本發明可以實現對用戶評論等的情感檢測;進一步地,結合了多重神經網絡跟注意力機制,從而提高了對于各種情緒相關的貼圖表情的辨識度;通過迭代器的方式來訓練模型從而節省了內存;通過遷移學習,并且逐步解凍可以訓練的參數,盡可能降低了遷移學習之后過擬合的風險,充分保留了預訓練模型的特性。
技術領域
本發明涉及情感分析領域,尤其涉及一種基于貼圖表情的情感檢測方法以及系統。
背景技術
隨著網絡的不斷發展以及社交平臺的快速壯大,互聯網中充斥著大量的非結構化文本數據,這里面含有很多有價值的,但是無法簡單處理,進行提取的信息。因此如果能夠自動對微博、評論等數據進行情感提取,則可以應用到產品或者服務的正負口碑監測,從而來改善產品功能或者服務的流程。
發明內容
本發明要解決的技術問題在于,針對現有技術的上述缺陷,提供一種基于貼圖表情的情感檢測方法以及系統。
本發明解決其技術問題所采用的技術方案是:構造一種基于貼圖表情的情感檢測方法,方法包括:
采集帶有貼圖表情的文本數據;
對所采集來的數據進行預處理,轉換為詞向量數據集;
將數據預處理單元生成的數據集輸入一個已經訓練好的網絡模型,該網絡模型輸出相應的情感檢測結果。
在本發明所述的基于貼圖表情的情感檢測方法中,所述網絡模型包括:
輸入層,用于接收輸入的數據集并輸出到嵌入層;
嵌入層,接受輸入層輸出的數據集,將數據集中不可用的數據剔除后輸出到激活函數層;
激活函數層,接收來自嵌入層的數據集,在所設置的斷開鏈接比例不為0時構建丟棄層,對數據進行變換后輸出到丟棄層;在所設置的斷開鏈接比例為0時,對數據進行變換后輸出到雙LSTM層;
丟棄層,接收來自激活函數層的數據集,隨機將丟棄層的前一個層的輸入神經元斷開一定百分比,并輸出數據集至雙LSTM層;
雙LSTM層,接收來自丟棄層或者激活函數層的數據集,并傳給第一個BiLSTM層,將第一個BiLSTM層的輸出傳給第二個BiLSTM層,將雙LSTM層的前一個層所得到的輸出跟兩個BiLSTM層的兩個輸出進行合并,輸出處理后的數據到關注層;
關注層,接收來自雙LSTM層的數據集,通過注意力機制獲取權重的張量,并輸出處理后的數據集和權重到分類器;
分類層,接收來自關注層的數據集和權重,處理得到情感檢測結果,所述情感檢測結果包括各種情感類型及其概率。
在本發明所述的基于貼圖表情的情感檢測方法中,所述分類層包括softmax分類器和sigmoid分類器,如果需要預測的情感類型的個數大于兩種類別,則使用softmax分類器,如果需要預測的情感類型的個數為兩種,則使用sigmoid分類器。
在本發明所述的基于貼圖表情的情感檢測方法中,所述方法還包括,在網絡模型投入使用之前,執行以下訓練步驟:
采集帶有多種常見貼圖表情的文本數據;
對所采集來的數據進行預處理,轉換為詞向量數據集,并且對數據集進行情感類型劃分;
將數據集中的部分作為訓練數據、剩余部分作為測試數據;
利用訓練數據對所述網絡模型進行訓練;
利用訓練好的網絡模型對所述測試數據進行預測,記錄情感檢測結果;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市云網拜特科技有限公司,未經深圳市云網拜特科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711407785.4/2.html,轉載請聲明來源鉆瓜專利網。





