[發(fā)明專利]一種知識(shí)感知的情感分析方法在審
| 申請(qǐng)?zhí)枺?/td> | 202110572656.0 | 申請(qǐng)日: | 2021-05-25 |
| 公開(kāi)(公告)號(hào): | CN113191160A | 公開(kāi)(公告)日: | 2021-07-30 |
| 發(fā)明(設(shè)計(jì))人: | 柯尊旺;李哲;劉士坤;代立;韓華偉 | 申請(qǐng)(專利權(quán))人: | 新疆大學(xué) |
| 主分類號(hào): | G06F40/30 | 分類號(hào): | G06F40/30;G06F40/253;G06F40/242;G06F40/211;G06N3/04;G06N3/08 |
| 代理公司: | 西安銘澤知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 61223 | 代理人: | 張舉 |
| 地址: | 830008 新疆維吾爾自治區(qū)*** | 國(guó)省代碼: | 新疆;65 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 知識(shí) 感知 情感 分析 方法 | ||
本發(fā)明提供了一種知識(shí)感知的情感分析方法,屬于人工智能領(lǐng)域,包括:收集自然語(yǔ)言解釋ei,并利用語(yǔ)義解析器將收集的自然語(yǔ)言解釋ei生成一系列候選標(biāo)簽函數(shù);將候選標(biāo)簽函數(shù)輸入到過(guò)濾器組中進(jìn)行過(guò)濾,剔除超過(guò)設(shè)定閾值的候選標(biāo)簽函數(shù);將剩余的候選標(biāo)簽函數(shù)應(yīng)用于未標(biāo)注的樣本實(shí)例,并生成標(biāo)注矩陣,將標(biāo)注矩陣傳遞給標(biāo)注聚合器,所述標(biāo)注聚合器將標(biāo)注矩陣中存在潛在沖突和重疊的標(biāo)注集成到每個(gè)樣本中生成新的標(biāo)注;利用生成的新的標(biāo)注對(duì)情感分類器判別模型進(jìn)行訓(xùn)練,根據(jù)所述情感分類器判別模型進(jìn)行情感分析。該方法在解決公開(kāi)情感分析數(shù)據(jù)集的標(biāo)注數(shù)據(jù)稀缺性和類別不平衡問(wèn)題方面具有潛在的效率和有效性。
技術(shù)領(lǐng)域
本發(fā)明屬于人工智能領(lǐng)域,具體涉及一種知識(shí)感知的情感分析方法。
背景技術(shù)
情感分析是輿情分析的關(guān)鍵,它可以為人們提供有價(jià)值的情感傾向。現(xiàn)有的情感分析方法依賴于從用戶生成的內(nèi)容中尋找情感元素。然而,為什么一個(gè)信息產(chǎn)生某種情感的原因在以前的作品中并沒(méi)有很好地探索或利用。
情感分析是自然語(yǔ)言處理中的一項(xiàng)重要任務(wù),也是一些流行的下游任務(wù)的核心,如輿情分析。這項(xiàng)任務(wù)的重點(diǎn)是預(yù)測(cè)一個(gè)給定輸入句子的情感信息。然而,以前的工作通常需要大量的標(biāo)記數(shù)據(jù),這限制了它們?cè)跀?shù)據(jù)標(biāo)注昂貴的情況下的應(yīng)用。
提供監(jiān)督的傳統(tǒng)方法是通過(guò)人為生成的標(biāo)簽。例如,如果你說(shuō)一句話,“不管怎樣,食物不錯(cuò),價(jià)格合適,他們的酒單不錯(cuò)”,標(biāo)注員應(yīng)該標(biāo)注為“積極”。然而,標(biāo)簽并沒(méi)有提供關(guān)于如何做出決定的信息。一種信息更豐富的方法是讓注釋器能夠用自然語(yǔ)言解釋他們的決定,這樣注釋就可以推廣到其他示例。
在上面的例子中,一種解釋可以是“積極的,因?yàn)樵~語(yǔ)‘食物’出現(xiàn)在‘非常好’之前,詞語(yǔ)‘價(jià)格出現(xiàn)在詞語(yǔ)‘合理之前,在兩個(gè)詞語(yǔ)中,這可以概括為“價(jià)格合理的美味食物”。自然語(yǔ)言解釋顯示了提供額外監(jiān)督的有效性,特別是在低資源環(huán)境下。此外,可以很容易地從人類注釋人員那里收集它們,而無(wú)需顯著增加注釋工作。
然而,由于人類語(yǔ)言的復(fù)雜性,利用自然語(yǔ)言解釋作為監(jiān)督是具有挑戰(zhàn)性的。首先,文本數(shù)據(jù)的結(jié)構(gòu)不是很好,因此必須將解釋解析為邏輯形式,以便機(jī)器能夠更好地利用它們。此外,語(yǔ)言變體是普遍存在的,這使得很難概括出一個(gè)自然語(yǔ)言解釋來(lái)匹配語(yǔ)義等價(jià)但單詞用法不同的句子。當(dāng)前面的例子解釋進(jìn)行精確匹配時(shí),它可能無(wú)法給句子標(biāo)注“合理的價(jià)格”或“好面包”。
在用自然語(yǔ)言解釋訓(xùn)練分類器方面已經(jīng)做了一些嘗試。之前的作品依賴于識(shí)別相關(guān)的輸入部分,包括標(biāo)記特征,突出文本中的基本原理短語(yǔ),或者標(biāo)記圖像中的相關(guān)區(qū)域。然而,某些類型的信息不能簡(jiǎn)單地歸因于注釋輸入的某一部分,例如缺少一個(gè)單詞或至少兩個(gè)單詞。因此,自然語(yǔ)言解釋的泛化能力尚未得到充分的探索。綜上所述,一個(gè)好的數(shù)據(jù)注釋方法應(yīng)該滿足一下兩點(diǎn):1)能夠?qū)⒆⑨尫夯秸Z(yǔ)義相似的實(shí)例(超出詞干、詞性等);2)對(duì)注釋中的不確定性進(jìn)行建模。
因此,本身提出一種知識(shí)感知的情感分析方法。
發(fā)明內(nèi)容
為了克服上述現(xiàn)有技術(shù)存在的不足,為了應(yīng)對(duì)這一挑戰(zhàn),本發(fā)明提出了一個(gè)用于情感分析的自然語(yǔ)言解釋框架,該框架為每個(gè)新的情感標(biāo)簽提供足夠的領(lǐng)域知識(shí)來(lái)生成額外的標(biāo)記數(shù)據(jù)。基于規(guī)則的語(yǔ)義解析器將這些解釋轉(zhuǎn)換為程序化標(biāo)記函數(shù),為任意數(shù)量的未標(biāo)記情感信息生成噪聲標(biāo)簽,以訓(xùn)練情感分析分類器。
本發(fā)明提出SANLE框架,通過(guò)語(yǔ)義解析器對(duì)數(shù)據(jù)集進(jìn)行自然語(yǔ)言解釋作為外部知識(shí),并將知識(shí)嵌入作為輸入,與詞嵌入共同訓(xùn)練情感分析模型。SANLE框架通過(guò)自然語(yǔ)言解釋將未標(biāo)記數(shù)據(jù)轉(zhuǎn)換為帶有噪聲標(biāo)記的訓(xùn)練集。SANLE三個(gè)關(guān)鍵組件組成:語(yǔ)義解析器、標(biāo)簽過(guò)濾器和標(biāo)簽聚合器。語(yǔ)義解析器將自然語(yǔ)言解釋轉(zhuǎn)換成一系列表示標(biāo)記函數(shù)的邏輯形式。標(biāo)簽過(guò)濾器刪除一些可能超過(guò)所需閾值的不正確的標(biāo)簽函數(shù)。其余的標(biāo)記功能應(yīng)用于未標(biāo)記的實(shí)例,以生成標(biāo)記矩陣。這個(gè)標(biāo)記矩陣被傳遞給標(biāo)記聚合器,該聚合器將這些潛在沖突和重疊的標(biāo)記集成到每個(gè)示例的一個(gè)標(biāo)記中生成新的標(biāo)注。生成的新的標(biāo)注用于訓(xùn)練任何判別模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于新疆大學(xué),未經(jīng)新疆大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110572656.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 基于本體的知識(shí)地圖繪制系統(tǒng)
- 基于知識(shí)地圖的領(lǐng)域知識(shí)瀏覽方法
- 一種基于知識(shí)本體的知識(shí)體系的建模方法
- 一種知識(shí)工程系統(tǒng)
- 知識(shí)自動(dòng)化系統(tǒng)和方法以及存儲(chǔ)器
- 基于SOLR的知識(shí)管理系統(tǒng)
- 基于知識(shí)節(jié)點(diǎn)所屬度的知識(shí)圖譜構(gòu)建方法和裝置
- 一種基于知識(shí)圖譜的稅務(wù)知識(shí)庫(kù)系統(tǒng)
- 一種智聯(lián)網(wǎng)中的網(wǎng)絡(luò)知識(shí)統(tǒng)一表征架構(gòu)及實(shí)現(xiàn)方法
- 知識(shí)點(diǎn)存儲(chǔ)方法、裝置、服務(wù)器及介質(zhì)
- 基于策略的業(yè)務(wù)感知模型及感知方法
- 一種基于分區(qū)感知的無(wú)線通信系統(tǒng)頻譜感知方法
- 確定空閑頻段的方法和系統(tǒng)、中心節(jié)點(diǎn)和感知節(jié)點(diǎn)
- 感知無(wú)線網(wǎng)絡(luò)的共享協(xié)作頻譜感知方法、感知節(jié)點(diǎn)和匯聚中心
- 感知無(wú)線網(wǎng)絡(luò)的協(xié)作頻譜感知方法和感知節(jié)點(diǎn)
- 頻譜感知方法、頻譜感知設(shè)備和數(shù)據(jù)庫(kù)
- 基于認(rèn)知數(shù)據(jù)庫(kù)和頻譜感知的頻譜共享方法及裝置
- 一種頂層感知限位組
- 一種自動(dòng)駕駛汽車用升降式智能感知模塊
- 感知數(shù)據(jù)獲取方法和裝置





