[發(fā)明專利]一種基于Attention機(jī)制來(lái)構(gòu)建老撾語(yǔ)詞性標(biāo)注模型的方法在審
| 申請(qǐng)?zhí)枺?/td> | 201811532384.6 | 申請(qǐng)日: | 2018-12-14 |
| 公開(kāi)(公告)號(hào): | CN109753652A | 公開(kāi)(公告)日: | 2019-05-14 |
| 發(fā)明(設(shè)計(jì))人: | 周蘭江;王興金;張建安;周楓 | 申請(qǐng)(專利權(quán))人: | 昆明理工大學(xué) |
| 主分類號(hào): | G06F17/27 | 分類號(hào): | G06F17/27;G06N3/04 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 650093 云*** | 國(guó)省代碼: | 云南;53 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 解碼 語(yǔ)義向量 標(biāo)注 編碼層 構(gòu)建 詞性標(biāo)注 詞性標(biāo)注模型 機(jī)器學(xué)習(xí)技術(shù) 輸入序列信息 自然語(yǔ)言處理 機(jī)制建立 句子輸入 句子信息 輸入序列 老撾語(yǔ) 詞性 語(yǔ)料 研究 | ||
1.一種基于Attention機(jī)制來(lái)構(gòu)建老撾語(yǔ)詞性標(biāo)注模型的方法,其特征在于:包括如下步驟:
Step1、Attention機(jī)制的構(gòu)建
Attention機(jī)制包括兩層:編碼層與解碼層,編碼層用于老撾語(yǔ)的輸入,解碼層用于計(jì)算出每個(gè)老撾詞的詞性;
Step 1.1、編碼層
編碼層是基于GRU來(lái)構(gòu)建,在編碼層構(gòu)建了兩層雙向GRU,在編碼時(shí),老撾句子中的第一個(gè)詞將按序進(jìn)入GRU中進(jìn)行處理,GRU會(huì)保留并輸出對(duì)詞性計(jì)算有用的信息,并除去無(wú)用信息,信息以向量的形式呈現(xiàn),在編碼層加入了BahdanauAttention機(jī)制,BahdanauAttention機(jī)制是注意力機(jī)制的一種,首先它會(huì)選擇編碼層每個(gè)詞的GRU輸出向量,然后根據(jù)每個(gè)向量的重要程度而賦予不同權(quán)重,最后使用輸出向量與權(quán)重計(jì)算語(yǔ)義向量C,語(yǔ)義向量C將被輸入到解碼層;
Step 1.2、解碼層
解碼層同樣是基于GRU來(lái)構(gòu)建,在解碼層使用單層GRU,在解碼運(yùn)算中,首先該層GRU會(huì)根據(jù)語(yǔ)義向量C計(jì)算出詞性信息向量,然后詞性信息向量會(huì)傳遞給Softmax函數(shù),Softmax函數(shù)來(lái)計(jì)算出詞性概率分布;
Step2、Attention機(jī)制的訓(xùn)練
當(dāng)Attention機(jī)制搭建完成后,使用老撾語(yǔ)詞性標(biāo)注語(yǔ)料庫(kù)對(duì)Attention機(jī)制的參數(shù)進(jìn)行訓(xùn)練,直到模型達(dá)到穩(wěn)定狀態(tài),就得到Attention機(jī)制,訓(xùn)練過(guò)程中,首先使用交叉熵?fù)p失函數(shù)來(lái)計(jì)算解碼層輸出的詞性概率分布與真實(shí)分布的差距,然后使用Adam算法來(lái)減少差距,以此訓(xùn)練Attention機(jī)制的參數(shù);
Step3、選擇詞性概率分布中概率最大的詞性作為輸出;
Step4、在對(duì)老撾句子詞性標(biāo)注時(shí),Attention機(jī)制循環(huán)Step1,Step3,對(duì)老撾句子中的每一個(gè)詞進(jìn)行處理,就可以得到該老撾句子的詞性。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于昆明理工大學(xué),未經(jīng)昆明理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811532384.6/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:一種針對(duì)體現(xiàn)用戶意圖的APP軟件用戶評(píng)論挖掘方法
- 下一篇:實(shí)體名稱識(shí)別方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種分布式的文本近似最近鄰語(yǔ)義搜索計(jì)算方法
- 一種基于深度學(xué)習(xí)的圖像個(gè)性化語(yǔ)義分析方法、裝置及設(shè)備
- 用于聚類句子的方法和裝置
- 一種基于變壓器模型和多參照系的文本編碼表示方法
- 查詢結(jié)果的確定方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 文本語(yǔ)義匹配方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 語(yǔ)義情緒識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 結(jié)合知識(shí)圖譜實(shí)體信息的語(yǔ)義識(shí)別方法、裝置及相關(guān)設(shè)備
- 文本處理、文本處理模型訓(xùn)練方法、裝置和存儲(chǔ)介質(zhì)
- 答非所問(wèn)識(shí)別模型的訓(xùn)練方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 標(biāo)注信息生成裝置、查詢裝置及共享系統(tǒng)
- 一種圖像分割標(biāo)注方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)標(biāo)注方法
- 一種基于群智的語(yǔ)料庫(kù)數(shù)據(jù)標(biāo)注方法及系統(tǒng)
- 一種圖像標(biāo)注方法和裝置
- 一種樣本標(biāo)注方法、裝置、存儲(chǔ)介質(zhì)及設(shè)備
- 數(shù)據(jù)標(biāo)注管理方法及裝置、電子設(shè)備和可讀存儲(chǔ)介質(zhì)
- 標(biāo)注的更新方法、裝置、存儲(chǔ)介質(zhì)、處理器以及運(yùn)載工具
- 數(shù)據(jù)的標(biāo)注方法和裝置
- 一種智能標(biāo)注平臺(tái)的方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 音頻編碼設(shè)備、音頻解碼設(shè)備、音頻編碼方法和音頻解碼方法
- 一種視頻序列編解碼體系結(jié)構(gòu)
- 筆跡檢測(cè)片和手寫(xiě)系統(tǒng)
- 視頻編碼處理方法和裝置
- 一種可分層音頻編碼、解碼方法及系統(tǒng)
- 可分層音頻編解碼方法系統(tǒng)及瞬態(tài)信號(hào)可分層編解碼方法
- 一種電網(wǎng)全息數(shù)字地圖視頻編碼方法及系統(tǒng)
- 運(yùn)動(dòng)圖像編碼方法、運(yùn)動(dòng)圖像編碼裝置、及運(yùn)動(dòng)圖像解碼方法以及運(yùn)動(dòng)圖像解碼裝置
- 供應(yīng)鏈隨貨單編碼及其編碼規(guī)則和使用方法
- 一種光子計(jì)數(shù)成像探測(cè)器





