[發(fā)明專利]一種融合先驗(yàn)知識(shí)模型的蒙古語多模態(tài)細(xì)粒度情感分析方法在審
| 申請(qǐng)?zhí)枺?/td> | 202110765525.4 | 申請(qǐng)日: | 2021-07-07 |
| 公開(公告)號(hào): | CN113609849A | 公開(公告)日: | 2021-11-05 |
| 發(fā)明(設(shè)計(jì))人: | 仁慶道爾吉;張倩;張文靜;劉馨遠(yuǎn);張畢力格圖;郎佳珺;蘇依拉;李雷孝 | 申請(qǐng)(專利權(quán))人: | 內(nèi)蒙古工業(yè)大學(xué) |
| 主分類號(hào): | G06F40/284 | 分類號(hào): | G06F40/284;G06F40/30;G06F40/242;G06F40/58;G06N3/04;G06N3/08 |
| 代理公司: | 武漢菲翔知識(shí)產(chǎn)權(quán)代理有限公司 42284 | 代理人: | 劉谷紅 |
| 地址: | 010080 內(nèi)蒙古自治區(qū)呼和浩*** | 國(guó)省代碼: | 內(nèi)蒙古;15 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 融合 先驗(yàn) 知識(shí) 模型 蒙古語 多模態(tài) 細(xì)粒度 情感 分析 方法 | ||
本發(fā)明公開了一種融合先驗(yàn)知識(shí)模型的蒙古語多模態(tài)細(xì)粒度情感分析方法,對(duì)含有表情符的中文和蒙古語情感語料庫(kù)進(jìn)行預(yù)處理;分別將經(jīng)過預(yù)處理得到的文本詞和表情符轉(zhuǎn)換為動(dòng)態(tài)詞向量;引入注意力機(jī)制對(duì)文本詞量和表情符詞向量拼接的詞向量進(jìn)行細(xì)粒度情感分析;并分別創(chuàng)建蒙古語情感詞典和表情符的情感詞典將二者提取的特征作為模型最終提取的情感特征;將融入先驗(yàn)知識(shí)的模型在大規(guī)模中文及蒙古語語料上進(jìn)行預(yù)訓(xùn)練,得到融合先驗(yàn)知識(shí)模型的蒙古語多模態(tài)細(xì)粒度情感分析模型;將該模型的分析結(jié)果與單一網(wǎng)絡(luò)分析方法的分析結(jié)果就每個(gè)情感類別的準(zhǔn)確率、精確率、召回率和F1值進(jìn)行對(duì)比和評(píng)價(jià),達(dá)到提高蒙古語文本情感分析性能的目的。
技術(shù)領(lǐng)域
本發(fā)明屬于人工智能技術(shù)領(lǐng)域,特別涉及一種融合先驗(yàn)知識(shí)模型的蒙古語 多模態(tài)細(xì)粒度情感分析方法。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,越來越多的人開始在社交平臺(tái)諸如微博、論 壇、影視網(wǎng)站、購(gòu)物網(wǎng)站等平臺(tái)發(fā)表各種言論,以此來分享自己的心情、觀點(diǎn) 和意見。特別的是,隨著網(wǎng)絡(luò)技術(shù)的快速發(fā)展,表情符逐漸發(fā)展為一種有別于 文本、圖像、視頻一種新的數(shù)據(jù)形式,在情感分析領(lǐng)域發(fā)揮著重要作用。用戶 發(fā)表的文本、表情符等信息可能包含不同的感情色彩:有開心的或是喜愛的; 悲傷的亦或是憤怒的。情感分析的核心是將一段文本所表達(dá)的情感準(zhǔn)確的分為 happiness、like、sadness、surprise、disgust、fear、anger七個(gè)類別。
隨著人工智能的崛起,深度學(xué)習(xí)方法得到了廣泛的關(guān)注,因其模型具有強(qiáng)大的 特征學(xué)習(xí)能力,所以逐漸成為了解決情感分類問題的重要方法。但對(duì)于蒙古語 這樣的小語種來說,現(xiàn)有的情感分析方法存在以下三點(diǎn)不足。其一,由于蒙古 語詞匯豐富形態(tài)變化多,就造成了在蒙古語文本情感分析過程中出現(xiàn)了嚴(yán)重的 未登錄詞現(xiàn)象,而大量未登錄詞的存在嚴(yán)重影響情感分析的準(zhǔn)確率。其二,當(dāng) 前情感分析主要對(duì)文本數(shù)據(jù)進(jìn)行分析,對(duì)于含有表情符的數(shù)據(jù)一般在數(shù)據(jù)清洗 階段將表情符等重要信息做了刪除處理,不能充分表情符這一情感分析重要特 征。其三,目前單一的神經(jīng)網(wǎng)絡(luò)模型在解決情感分析時(shí)分類效率有限,局限于 某些特征數(shù)據(jù)信息。
發(fā)明內(nèi)容
為了克服上述現(xiàn)有技術(shù)的缺點(diǎn),本發(fā)明的目的在于提供一種融合先驗(yàn)知識(shí) 模型的蒙古語多模態(tài)細(xì)粒度情感分析方法,具有以下三個(gè)特點(diǎn):第一,將中文 的jieba分詞和字符對(duì)編碼BPE技術(shù)結(jié)合對(duì)數(shù)據(jù)進(jìn)行分詞,并利用詞向量修正方 法,更好的緩解因蒙古語語法的復(fù)雜性而出現(xiàn)的未登錄詞問題;第二,通過預(yù) 訓(xùn)練模型分別將文本和表情符表示成向量的形式,并將二者拼接成向量作為每 條數(shù)據(jù)的向量特征,以充分利用原始數(shù)據(jù)中的文本和表情符的情感特征,達(dá)到 多方位分析情感目標(biāo)的目的;第三,通過構(gòu)建蒙古語情感詞典和表情符的情感 詞典作為預(yù)訓(xùn)練模型的先驗(yàn)知識(shí),充分利用了蒙古語情感詞匯及含有情感表情 符的重要情感特征,以提高蒙古語文本情感分析的質(zhì)量。
為了實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案是:
一種融合先驗(yàn)知識(shí)模型的蒙古語多模態(tài)細(xì)粒度情感分析方法,包括如下步驟:
步驟1:對(duì)含有表情符的中文和蒙古語情感語料庫(kù)進(jìn)行預(yù)處理;
步驟2:通過機(jī)器翻譯技術(shù)將含有表情符的中文語料翻譯成蒙古語語料;
步驟3:用融合jieba分詞和正則化的BPE分詞技術(shù)對(duì)蒙古語語料進(jìn)行分詞;
步驟4:將分詞得到的蒙古語文本語料和表情符表示成動(dòng)態(tài)詞向量并將二者拼接成新的詞向量;
步驟5:引入注意力機(jī)制對(duì)新的詞向量分配不同的權(quán)重,有側(cè)重點(diǎn)地提取情感特征。
步驟6:分別創(chuàng)建蒙古語情感詞典和表情符的情感詞典作為模型的先驗(yàn)知識(shí);
步驟7:將融合先驗(yàn)知識(shí)的模型在大規(guī)模的語料進(jìn)行預(yù)訓(xùn)練,得到融合先驗(yàn)知識(shí)模型的蒙古語多模態(tài)細(xì)粒度情感分析模型;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于內(nèi)蒙古工業(yè)大學(xué),未經(jīng)內(nèi)蒙古工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110765525.4/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種基于混合貝葉斯先驗(yàn)分布的可靠性驗(yàn)證測(cè)試方法
- 一種基于注意力先驗(yàn)的胃鏡視頻摘要方法
- 一種先驗(yàn)頻點(diǎn)排序的方法及裝置
- 一種混合相位子波提取方法
- 視頻預(yù)測(cè)方法和裝置、電子設(shè)備及車輛
- 視頻預(yù)測(cè)方法、視頻預(yù)測(cè)裝置、電子設(shè)備和車輛
- 一種應(yīng)用于神經(jīng)網(wǎng)絡(luò)的先驗(yàn)框確定方法及裝置
- 基于先驗(yàn)地圖信息的障礙物檢測(cè)方法、裝置和存儲(chǔ)介質(zhì)
- 處理傳感器信息以供對(duì)象檢測(cè)
- 一種病變圖像的病灶檢測(cè)方法及裝置
- 基于本體的知識(shí)地圖繪制系統(tǒng)
- 基于知識(shí)地圖的領(lǐng)域知識(shí)瀏覽方法
- 一種基于知識(shí)本體的知識(shí)體系的建模方法
- 一種知識(shí)工程系統(tǒng)
- 知識(shí)自動(dòng)化系統(tǒng)和方法以及存儲(chǔ)器
- 基于SOLR的知識(shí)管理系統(tǒng)
- 基于知識(shí)節(jié)點(diǎn)所屬度的知識(shí)圖譜構(gòu)建方法和裝置
- 一種基于知識(shí)圖譜的稅務(wù)知識(shí)庫(kù)系統(tǒng)
- 一種智聯(lián)網(wǎng)中的網(wǎng)絡(luò)知識(shí)統(tǒng)一表征架構(gòu)及實(shí)現(xiàn)方法
- 知識(shí)點(diǎn)存儲(chǔ)方法、裝置、服務(wù)器及介質(zhì)





