[發(fā)明專利]一種基于siamese網(wǎng)絡(luò)和多核心LEAM架構(gòu)的中文文本難度評(píng)估方法有效
| 申請(qǐng)?zhí)枺?/td> | 201911192918.X | 申請(qǐng)日: | 2019-11-28 |
| 公開(公告)號(hào): | CN111090985B | 公開(公告)日: | 2023-04-28 |
| 發(fā)明(設(shè)計(jì))人: | 曾致中;方淙;余新國(guó);陳志平;王靜靜;袁航;熊佳潔 | 申請(qǐng)(專利權(quán))人: | 華中師范大學(xué) |
| 主分類號(hào): | G06F40/205 | 分類號(hào): | G06F40/205;G06F16/35 |
| 代理公司: | 武漢東喻專利代理事務(wù)所(普通合伙) 42224 | 代理人: | 宋敏 |
| 地址: | 430079 湖*** | 國(guó)省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 siamese 網(wǎng)絡(luò) 多核 leam 架構(gòu) 中文 文本 難度 評(píng)估 方法 | ||
1.一種基于siamese網(wǎng)絡(luò)和多核心LEAM架構(gòu)的中文文本難度評(píng)估方法,其特征在于,包括如下步驟:
S1、確定分類依據(jù)并歸納出不同的label;
S2、利用分類的依據(jù),將不同類型的文章數(shù)據(jù)集進(jìn)行正確的劃分;
S3、使用LEAM結(jié)構(gòu)利用所有l(wèi)abel的空間域分布與每個(gè)詞的Embedding編碼的距離遠(yuǎn)近分配attention的權(quán)重;
S4、將label嵌入進(jìn)中文文本的Embedding空間中,得到label的多維向量表示;
S5、針對(duì)于每一個(gè)類別,人工選出一篇最能代表該類別的文章,將這篇文章編碼,作為Siamese網(wǎng)絡(luò)的一個(gè)輸入;
S6、得到的文本編碼與基準(zhǔn)做差值然后送入softmax分類;
S7、根據(jù)與不同類型文本的相似度最后得出分類結(jié)果;
步驟S3-S4具體為:
文本的分類標(biāo)簽y通過多個(gè)不同的標(biāo)簽嵌入錨點(diǎn)的編碼向量進(jìn)行編碼,再與文本中選取的一句話x經(jīng)字詞編碼成向量后、進(jìn)行向量的點(diǎn)乘,得到權(quán)重矩陣G,標(biāo)簽嵌入注意力的權(quán)重β,再與文本中選取的該一句話x經(jīng)字詞編碼成向量后、進(jìn)行向量的點(diǎn)乘,得到該一句話x的輸出編碼Zi;
步驟S5-S6具體為:
預(yù)處理好后的文章X和預(yù)處理好后的標(biāo)準(zhǔn)文章Y,經(jīng)過步驟S3-S4將所有的句子進(jìn)行編碼處理,得到編碼向量組成的矩陣,一起進(jìn)行一個(gè)pooling操作,再進(jìn)行向量減法,然后計(jì)算差值的神經(jīng)網(wǎng)絡(luò),送入sofmax分類;
步驟S5-S6中,根據(jù)預(yù)處理好后的標(biāo)準(zhǔn)文章Y輸入的參數(shù)的變化而衍生出多個(gè)不同的Classifier結(jié)構(gòu);
步驟S7具體為:
將一篇預(yù)處理好的文章X輸入到不同的Classifier結(jié)構(gòu)中,選取相似度最大值,最后將所有的相似度評(píng)估匯總得出最終的劃分結(jié)果Z。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華中師范大學(xué),未經(jīng)華中師范大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911192918.X/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種檢測(cè)方法及裝置
- 一種基于Siamese網(wǎng)絡(luò)的圖像檢索方法及系統(tǒng)
- 基于Siamese網(wǎng)絡(luò)的用于行人重識(shí)別的方法
- 一種基于siamese網(wǎng)絡(luò)的步態(tài)識(shí)別系統(tǒng)
- 基于排序損失和Siamese網(wǎng)絡(luò)的行人再識(shí)別方法
- 指靜脈數(shù)據(jù)擴(kuò)充后再識(shí)別的方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 一種基于Siamese結(jié)構(gòu)雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)的三維模型檢索方法
- 基于深度學(xué)習(xí)特征光流的醫(yī)學(xué)圖像形變配準(zhǔn)方法及系統(tǒng)
- 一種基于Siamese網(wǎng)絡(luò)的話題檢測(cè)方法
- 基于Siamese網(wǎng)絡(luò)結(jié)構(gòu)融合中層特征的行人重識(shí)別方法
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





