[發(fā)明專利]文本情感分析方法、系統(tǒng)及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)在審
| 申請?zhí)枺?/td> | 201810035601.4 | 申請日: | 2018-01-15 |
| 公開(公告)號(hào): | CN108170681A | 公開(公告)日: | 2018-06-15 |
| 發(fā)明(設(shè)計(jì))人: | 王斌;唐玲艷;劉家廣;嚴(yán)毅康;王淼;盛津芳 | 申請(專利權(quán))人: | 中南大學(xué) |
| 主分類號(hào): | G06F17/27 | 分類號(hào): | G06F17/27;G06N3/04 |
| 代理公司: | 長沙朕揚(yáng)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 43213 | 代理人: | 何湘玲 |
| 地址: | 410083 *** | 國省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 句子 向量 文本情感 詞性 計(jì)算機(jī)可讀存儲(chǔ)介質(zhì) 注意力 句子向量 文本單詞 隱藏層 攜帶 分析 詞性標(biāo)注信息 情感分類模型 人工智能技術(shù) 準(zhǔn)確度 詞性標(biāo)注 分類結(jié)果 情感分類 網(wǎng)絡(luò)模型 向量矩陣 原始文本 詞向量 求和 預(yù)設(shè) 加權(quán) 嵌入 | ||
1.一種文本情感分析方法,其特征在于,包括:
對原始文本進(jìn)行分詞,獲取文本單詞集,并對所獲取的文本單詞集訓(xùn)練生成詞向量矩陣;
對所述詞向量矩陣以句子為單位進(jìn)行拆分,將任一句子對應(yīng)的詞向量輸入至預(yù)設(shè)的LSTM網(wǎng)絡(luò)模型,得到各詞的隱藏層向量;且在將任一句子對應(yīng)的詞向量輸入至預(yù)設(shè)的LSTM網(wǎng)絡(luò)模型時(shí),一個(gè)詞對應(yīng)一個(gè)隱藏層單元,并通過LSTM相鄰隱藏層之間的關(guān)聯(lián)關(guān)系提取句子上下文之間的隱藏信息,并以句子最后一個(gè)詞所對應(yīng)的隱藏層向量作為整個(gè)句子的隱藏層向量;
對所獲取的文本單詞集進(jìn)行詞性標(biāo)注,對攜帶詞性標(biāo)注信息的文本單詞集訓(xùn)練,并對訓(xùn)練生成的詞性向量矩陣以詞為單位進(jìn)行拆分,得到各詞所對應(yīng)的詞性向量;
以句子為單位,根據(jù)句子內(nèi)各詞所對應(yīng)的隱藏層向量和詞性向量進(jìn)行詞嵌入加權(quán)求和注意力分析,得到各句子攜帶注意力信息的句子向量,并以所述攜帶注意力信息的句子向量作為情感分類模型的輸入,進(jìn)而得到各句子的情感分類結(jié)果和/或所述原始文本的分類結(jié)果;
其中,所述詞嵌入加權(quán)求和的計(jì)算公式為:
上式中,n為句子內(nèi)詞數(shù)量,為句子內(nèi)序號(hào)為i的詞所對應(yīng)的隱藏層向量,為句子內(nèi)序號(hào)為i的詞所對應(yīng)的詞性向量,sentence(x)為句子注意力分析結(jié)果,attention(xi)為句子內(nèi)序號(hào)為i的詞所對應(yīng)注意力分析結(jié)果。
2.根據(jù)權(quán)利要求1所述的文本情感分析方法,其特征在于,采用下述選型方式中的任意一種或任意組合:
采用Attention模型進(jìn)行注意力分析;
采用softmax函數(shù)對映射到情感分類模型的文本向量進(jìn)行情感分類;
采用jieba進(jìn)行分詞和詞性標(biāo)注處理;
采用word2vec進(jìn)行訓(xùn)練以分別生成詞向量矩陣和詞性向量矩陣。
3.一種文本情感分析系統(tǒng),包括存儲(chǔ)器、處理器以及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述權(quán)利要求1或2所述方法的步驟。
4.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述權(quán)利要求1或2所述方法的步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中南大學(xué),未經(jīng)中南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810035601.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 移動(dòng)向量解碼方法和移動(dòng)向量解碼裝置
- 一種用于支持向量機(jī)的在線向量選取方法
- 用于在幀序列中執(zhí)行運(yùn)動(dòng)估計(jì)的數(shù)據(jù)處理系統(tǒng)和方法
- 神經(jīng)網(wǎng)絡(luò)的處理方法及裝置、存儲(chǔ)介質(zhì)、電子設(shè)備
- 字符序列處理方法及設(shè)備
- 向量獲取方法、裝置、電子設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 向量獲取方法、裝置、電子設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 近鄰向量的召回方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種向量運(yùn)算裝置及運(yùn)算方法
- 生成類別向量的方法和裝置





