[發(fā)明專利]基于自注意力機(jī)制方面術(shù)語提取系統(tǒng)、方法、介質(zhì)、終端有效
| 申請?zhí)枺?/td> | 202110949000.6 | 申請日: | 2021-08-18 |
| 公開(公告)號: | CN113743099B | 公開(公告)日: | 2023-10-13 |
| 發(fā)明(設(shè)計(jì))人: | 石俊杰;王茜 | 申請(專利權(quán))人: | 重慶大學(xué) |
| 主分類號: | G06F40/253 | 分類號: | G06F40/253;G06F40/211;G06F40/30;G06F18/2415;G06N3/0442;G06N3/08 |
| 代理公司: | 重慶立信達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 50286 | 代理人: | 劉竹 |
| 地址: | 400044 *** | 國省代碼: | 重慶;50 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 注意力 機(jī)制 方面 術(shù)語 提取 系統(tǒng) 方法 介質(zhì) 終端 | ||
本發(fā)明屬于自然語言處理技術(shù)領(lǐng)域,公開了一種基于自注意力機(jī)制方面術(shù)語提取系統(tǒng)、方法、介質(zhì)、終端,包括:詞嵌入層利用詞性標(biāo)注工具進(jìn)行語句中各個(gè)單詞的詞性,并輸出句中每一個(gè)詞的詞性詞向量表示;第一BiReGU層對句子每一個(gè)單詞的前文信息和后文信息進(jìn)行處理,挖掘上下文信息,計(jì)算隱藏狀態(tài);單詞注意力計(jì)算層分配不同的權(quán)重,為句子的每個(gè)單詞生成不同的權(quán)重向量,并加權(quán)求和得到上下文向量;第二BiReGU層基于得到的權(quán)重向量與詞嵌入相結(jié)合進(jìn)行全局特征信息的提取;全連接層對提取信息進(jìn)行處理;CRF層進(jìn)行方面術(shù)語的標(biāo)記,提取得到相應(yīng)的方面術(shù)語。本發(fā)明能夠有效、準(zhǔn)確的進(jìn)行方面術(shù)語的提取。
技術(shù)領(lǐng)域
本發(fā)明屬于自然語言處理技術(shù)領(lǐng)域,尤其涉及一種基于自注意力機(jī)制方面術(shù)語提取系統(tǒng)、方法、介質(zhì)、終端。
背景技術(shù)
目前:方面術(shù)語提取(Aspect Term Extraction)作為ABSA的子任務(wù),也是一種特定領(lǐng)域的實(shí)體命名識(shí)別。例如,“The picture quality of my Motorola camera phone isamazing”中,從方面級情感分析的角度可以看出“picture quality”為方面術(shù)語,“amazing”是方面詞所對應(yīng)表達(dá)的情感觀點(diǎn)詞。所以方面術(shù)語提取是方面級情感分析中的一個(gè)關(guān)鍵問題,情感分析中先要去提取帶有情感的方面術(shù)語,再根據(jù)提取到的方面術(shù)語進(jìn)行情感分析。
通過上述分析,現(xiàn)有技術(shù)存在的問題及缺陷為:現(xiàn)有模型方法不能高效的挖掘單詞間的隱式關(guān)系,導(dǎo)致方面術(shù)語提取不完整、不全面,甚至可能提取到了非方面術(shù)語詞。
解決以上問題及缺陷的難度為:基于已有模型,將詞性信息與自注意力機(jī)制相結(jié)合,找到改善ReGU(Residual gated unit)模型依賴預(yù)訓(xùn)練詞向量模型作為輸入出現(xiàn)的詞共現(xiàn)信息不足現(xiàn)象的方法。
解決以上問題及缺陷的意義為:在準(zhǔn)確提取到方面術(shù)語詞之后,可以提高后續(xù)方面級情感分析的準(zhǔn)確性。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)存在的問題,本發(fā)明提供了一種基于自注意力機(jī)制方面術(shù)語提取系統(tǒng)、方法、介質(zhì)、終端。
本發(fā)明是這樣實(shí)現(xiàn)的,一種基于自注意力機(jī)制方面術(shù)語提取系統(tǒng),所述基于自注意力機(jī)制方面術(shù)語提取系統(tǒng)包括:
詞嵌入層,用于利用詞性標(biāo)注工具進(jìn)行語句中各個(gè)單詞的詞性,并輸出句中每一個(gè)詞的詞性詞向量表示;
第一BiReGU層,用于對句子每一個(gè)單詞的前文信息和后文信息進(jìn)行處理,挖掘輸入序列的上下文信息,深入地訓(xùn)練獲得有用的文本特征,并計(jì)算隱藏狀態(tài);
單詞注意力計(jì)算層,用于基于計(jì)算得到的隱藏狀態(tài)分配不同的權(quán)重,為句子的每個(gè)單詞生成不同的權(quán)重向量,并加權(quán)求和得到上下文向量;
第二BiReGU層,用于基于得到的權(quán)重向量與詞嵌入相結(jié)合進(jìn)行全局特征信息的提取;
全連接層,用于對提取信息進(jìn)行處理;
CRF層,用于進(jìn)行方面術(shù)語的標(biāo)記,提取得到相應(yīng)的方面術(shù)語。
本發(fā)明的另一目的在于提供一種應(yīng)用于所述基于自注意力機(jī)制方面術(shù)語提取系統(tǒng)的基于自注意力機(jī)制方面術(shù)語提取方法,所述基于自注意力機(jī)制方面術(shù)語提取方法包括:
首先,利用詞性標(biāo)注工具進(jìn)行語句中各個(gè)單詞的詞性,并輸出句中每一個(gè)詞的詞性詞向量表示;同時(shí)學(xué)習(xí)詞在內(nèi)容和詞性方面的長期依賴關(guān)系;
其次,通過自注意力機(jī)制為文本中的每個(gè)詞語賦予不同的權(quán)重;將得到的權(quán)重向量再次與詞嵌入相結(jié)合,學(xué)習(xí)全局的文本特征表示;
最后,考慮鄰居標(biāo)簽之間的相關(guān)性,進(jìn)行全局選擇,計(jì)算得到每一個(gè)單詞的標(biāo)簽;用IOB2格式標(biāo)記句子中的每個(gè)單詞,提取標(biāo)簽為B、I的單詞作為方面術(shù)語。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于重慶大學(xué),未經(jīng)重慶大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110949000.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于粒子濾波視覺注意力模型的運(yùn)動(dòng)目標(biāo)檢測方法
- 一種評測注意力狀態(tài)的方法及裝置
- 注意力測評方法、系統(tǒng)及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 兒童注意力評估系統(tǒng)及其方法
- 一種注意力檢測方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種注意力識(shí)別方法和裝置
- 一種可靠的用戶注意力監(jiān)測估計(jì)表示模型
- 注意力特征圖獲取方法及裝置、目標(biāo)檢測的方法及裝置
- 基于通道增強(qiáng)的雙注意力生成對抗網(wǎng)絡(luò)及圖像生成方法
- 一種文本情感分析模型的優(yōu)化方法及裝置
- 一種機(jī)制蛋的制造方法
- 手機(jī)制式的校準(zhǔn)方法、系統(tǒng)及手機(jī)檢測設(shè)備
- 一種考慮激勵(lì)機(jī)制電量電價(jià)彈性矩陣的耗電量估測方法
- 選擇區(qū)塊鏈共識(shí)機(jī)制的方法、裝置以及共識(shí)節(jié)點(diǎn)
- 一種復(fù)合改性機(jī)制砂及其制備方法
- 一種存儲(chǔ)設(shè)備糾錯(cuò)方法及糾錯(cuò)裝置
- 區(qū)塊鏈中共識(shí)機(jī)制的處理方法、裝置和電子設(shè)備
- 一種建筑用機(jī)制砂整形裝置
- 通信方法、通信裝置及存儲(chǔ)介質(zhì)
- 一種網(wǎng)絡(luò)預(yù)約出租車市場準(zhǔn)入機(jī)制的優(yōu)化方法及系統(tǒng)





