[發(fā)明專利]基于多模態(tài)特征和語(yǔ)義規(guī)則的文本抑郁傾向檢測(cè)系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 202110584120.0 | 申請(qǐng)日: | 2021-05-27 |
| 公開(kāi)(公告)號(hào): | CN113343706A | 公開(kāi)(公告)日: | 2021-09-03 |
| 發(fā)明(設(shè)計(jì))人: | 王紅;張慧;莊魯賀;韓書(shū);李威;楊杰;王正軍;楊雪;滑美芳 | 申請(qǐng)(專利權(quán))人: | 山東師范大學(xué) |
| 主分類號(hào): | G06F40/30 | 分類號(hào): | G06F40/30;G06F16/35;G06F40/205;G06F40/242;G06F40/253;G06F40/284;G06N3/04;G06N3/08 |
| 代理公司: | 濟(jì)南圣達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 37221 | 代理人: | 祖之強(qiáng) |
| 地址: | 250014 山*** | 國(guó)省代碼: | 山東;37 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 多模態(tài) 特征 語(yǔ)義 規(guī)則 文本 抑郁 傾向 檢測(cè) 系統(tǒng) | ||
1.一種基于多模態(tài)特征和語(yǔ)義規(guī)則的文本抑郁傾向檢測(cè)系統(tǒng),其特征在于:包括:
數(shù)據(jù)獲取模塊,被配置為:獲取待處理的文本數(shù)據(jù),對(duì)獲取的文本數(shù)據(jù)進(jìn)行預(yù)處理;
詞嵌入模塊,被配置為:根據(jù)預(yù)處理后的文本數(shù)據(jù)和預(yù)設(shè)詞嵌入模型,得到詞嵌入向量;
情感值特征向量獲取模塊,被配置為:根據(jù)預(yù)處理后的文本數(shù)據(jù)、預(yù)設(shè)情感詞典和預(yù)設(shè)語(yǔ)義規(guī)則,得到文本的情感值特征向量;
單詞級(jí)特征向量獲取模塊,被配置為:提取文本數(shù)據(jù)中的詞性特征向量,與詞嵌入向量拼接后,得到單詞級(jí)別的特征向量表示;
句子級(jí)特征向量獲取模塊,被配置為:提取文本數(shù)據(jù)中的詞頻特征向量,與情感值特征向量拼接后,得到句子級(jí)別的特征向量表示;
分類模塊,被配置為:根據(jù)單詞級(jí)別的特征向量表示、句子級(jí)別的特征向量表示以及預(yù)設(shè)CNN-BiLSTM網(wǎng)絡(luò)模型,得到最終的分類結(jié)果。
2.如權(quán)利要求1所述的基于多模態(tài)特征和語(yǔ)義規(guī)則的文本抑郁傾向檢測(cè)系統(tǒng),其特征在于:
分類模塊中,將單詞級(jí)別的特征向量表示和句子級(jí)別的特征向量表示,分別輸入到預(yù)設(shè)卷積神經(jīng)網(wǎng)絡(luò)中,將兩個(gè)卷積神經(jīng)網(wǎng)絡(luò)輸出的高層特征進(jìn)行融合后輸入到預(yù)設(shè)Bi-LSTM網(wǎng)絡(luò)模型中,得到分類結(jié)果。
3.如權(quán)利要求1所述的基于多模態(tài)特征和語(yǔ)義規(guī)則的文本抑郁傾向檢測(cè)系統(tǒng),其特征在于:
對(duì)獲取的文本數(shù)據(jù)進(jìn)行預(yù)處理,包括:
從文本數(shù)據(jù)中提取標(biāo)題、內(nèi)容和標(biāo)簽,去除由于已刪除內(nèi)容而缺少的數(shù)據(jù)以及不相關(guān)數(shù)據(jù),將文本數(shù)據(jù)轉(zhuǎn)換為小寫(xiě)字母。
4.如權(quán)利要求1所述的基于多模態(tài)特征和語(yǔ)義規(guī)則的文本抑郁傾向檢測(cè)系統(tǒng),其特征在于:
采用Word2vec詞嵌入模型生成嵌入向量。
5.如權(quán)利要求1所述的基于多模態(tài)特征和語(yǔ)義規(guī)則的文本抑郁傾向檢測(cè)系統(tǒng),其特征在于:
利用擴(kuò)充后的SenticNet4情感詞典,根據(jù)情感詞典中每個(gè)單詞的情感極性值和預(yù)設(shè)語(yǔ)義規(guī)則,進(jìn)行句子情感值計(jì)算,得到文本的情感值特征向量。
6.如權(quán)利要求1所述的基于多模態(tài)特征和語(yǔ)義規(guī)則的文本抑郁傾向檢測(cè)系統(tǒng),其特征在于:
語(yǔ)義規(guī)則,包括:
若文本數(shù)據(jù)中出現(xiàn)感嘆號(hào)或者問(wèn)號(hào),文本或句子的情感極性增強(qiáng);
或者,
若句子同時(shí)含有大小寫(xiě),全部大寫(xiě)的單詞情感強(qiáng)度增強(qiáng);
或者,
若句子中的情感詞前面存在程度副詞,文本或句子的情感極性增強(qiáng)。
7.如權(quán)利要求1所述的基于多模態(tài)特征和語(yǔ)義規(guī)則的文本抑郁傾向檢測(cè)系統(tǒng),其特征在于:
語(yǔ)義規(guī)則,還包括:
如果句子中存在轉(zhuǎn)折連詞,只考慮轉(zhuǎn)折連詞后面的句子情感極性;
或者,
如果句子中存在否定詞,考慮否定詞相關(guān)聯(lián)的詞的相反情感極性;
或者,
如果句子為反問(wèn)句,將句中情感詞乘以相應(yīng)的權(quán)值;
或者,
如果句子中包含表情符號(hào),根據(jù)表情符號(hào)所代表的含義判斷句子或文本的情感極性。
8.一種基于多模態(tài)特征和語(yǔ)義規(guī)則的文本抑郁傾向檢測(cè)方法,其特征在于:包括以下過(guò)程:
獲取待處理的文本數(shù)據(jù),對(duì)獲取的文本數(shù)據(jù)進(jìn)行預(yù)處理;
根據(jù)預(yù)處理后的文本數(shù)據(jù)和預(yù)設(shè)詞嵌入模型,得到詞嵌入向量;
根據(jù)預(yù)處理后的文本數(shù)據(jù)、預(yù)設(shè)情感詞典和預(yù)設(shè)語(yǔ)義規(guī)則,得到文本的情感值特征向量;
提取文本數(shù)據(jù)中的詞性特征向量,與詞嵌入向量拼接后,得到單詞級(jí)別的特征向量表示;
提取文本數(shù)據(jù)中的詞頻特征向量,與情感值特征向量拼接后,得到句子級(jí)別的特征向量表示;
根據(jù)單詞級(jí)別的特征向量表示、句子級(jí)別的特征向量表示以及預(yù)設(shè)CNN-BiLSTM網(wǎng)絡(luò)模型,得到最終的分類結(jié)果。
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有程序,其特征在于,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求8所述的基于多模態(tài)特征和語(yǔ)義規(guī)則的文本抑郁傾向檢測(cè)方法中的步驟。
10.一種電子設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的程序,其特征在于,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如權(quán)利要求8所述的基于多模態(tài)特征和語(yǔ)義規(guī)則的文本抑郁傾向檢測(cè)方法中的步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于山東師范大學(xué),未經(jīng)山東師范大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110584120.0/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 用于智能機(jī)器人系統(tǒng)多模態(tài)輸出的方法及裝置
- 一種基于深度學(xué)習(xí)的多模態(tài)醫(yī)學(xué)影像識(shí)別方法及裝置
- 一種基于多模態(tài)生成式對(duì)抗網(wǎng)絡(luò)的云圖分類方法
- 一種基于多模態(tài)信息的食道功能性疾病診斷系統(tǒng)
- 一種有監(jiān)督的快速離散多模態(tài)哈希檢索方法和系統(tǒng)
- 一種多模態(tài)數(shù)據(jù)處理方法及系統(tǒng)
- 一種基于多模態(tài)學(xué)習(xí)的電力攻擊識(shí)別方法
- 多源多模態(tài)數(shù)據(jù)的處理系統(tǒng)及應(yīng)用該系統(tǒng)的方法
- 一種基于門機(jī)制多模態(tài)融合的情感分析方法
- 面向?qū)捰蝻w行的多模態(tài)精確劃分方法
- 面向語(yǔ)義Web服務(wù)程序設(shè)計(jì)的語(yǔ)義數(shù)據(jù)表示和處理方法
- 一種基于語(yǔ)義的三維模型檢索系統(tǒng)和方法
- 一種計(jì)算機(jī)語(yǔ)義工程系統(tǒng)
- 導(dǎo)航方法及裝置
- 一種分層次多語(yǔ)義網(wǎng)系統(tǒng)及方法
- 一種基于上下文的語(yǔ)義匹配方法和系統(tǒng)
- 遠(yuǎn)程語(yǔ)義識(shí)別方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于語(yǔ)義依存關(guān)系的醫(yī)療文本標(biāo)注方法
- 基于多級(jí)語(yǔ)義表征和語(yǔ)義計(jì)算的信號(hào)語(yǔ)義識(shí)別方法
- 語(yǔ)義分類方法及裝置、存儲(chǔ)介質(zhì)及電子設(shè)備





