[發(fā)明專利]基于答案類別和句法指導(dǎo)的案情閱讀理解方法在審
| 申請(qǐng)?zhí)枺?/td> | 202110448963.8 | 申請(qǐng)日: | 2021-04-25 |
| 公開(kāi)(公告)號(hào): | CN113076759A | 公開(kāi)(公告)日: | 2021-07-06 |
| 發(fā)明(設(shè)計(jì))人: | 線巖團(tuán);何正海;相艷;王紅斌;王蒙 | 申請(qǐng)(專利權(quán))人: | 昆明理工大學(xué) |
| 主分類號(hào): | G06F40/35 | 分類號(hào): | G06F40/35;G06F40/295;G06F16/35;G06N3/04 |
| 代理公司: | 昆明人從眾知識(shí)產(chǎn)權(quán)代理有限公司 53204 | 代理人: | 何嬌 |
| 地址: | 650093 云*** | 國(guó)省代碼: | 云南;53 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 答案 類別 句法 指導(dǎo) 案情 閱讀 理解 方法 | ||
1.基于答案類別和句法指導(dǎo)的案情閱讀理解方法,其特征在于:所述方法包括:
Step1、首先對(duì)訓(xùn)練數(shù)據(jù)中無(wú)答案類、是類否類進(jìn)行數(shù)據(jù)擴(kuò)充;
Step2、然后經(jīng)過(guò)數(shù)據(jù)預(yù)處理將數(shù)據(jù)輸入到詞嵌入層,在詞嵌入層對(duì)篇章和問(wèn)題進(jìn)行向量化;
Step3、緊接著在表示編碼層將文本的詞嵌入、詞性、命名實(shí)體、二進(jìn)制特性、詞注意力、字符注意力以及MT-LSTM向量進(jìn)行拼接綜合文本的整體信息編碼;
Step4、通過(guò)兩層GRU進(jìn)行上下文語(yǔ)義理解;
Step5、然后通過(guò)注意力及融合層進(jìn)行重要信息提取同時(shí)做答案有無(wú)二分類;
Step6、最終利用輸出層獲取答案的起始位置和答案三分類。
2.根據(jù)權(quán)利要求1所述的基于答案類別和句法指導(dǎo)的案情閱讀理解方法,其特征在于:所述Step1中,具體是把有答案片段的問(wèn)題對(duì)應(yīng)的篇章中的答案片段刪去和該問(wèn)題一起作為無(wú)答案類來(lái)擴(kuò)充無(wú)答案數(shù)據(jù),把是否類問(wèn)題中的實(shí)體換成對(duì)應(yīng)實(shí)體的英文表示來(lái)擴(kuò)充是否類數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的基于答案類別和句法指導(dǎo)的案情閱讀理解方法,其特征在于:所述Step1中,輸入是裁判文書(shū)的案情描述和相關(guān)的問(wèn)題,分別為和經(jīng)數(shù)據(jù)擴(kuò)充及Step2的數(shù)據(jù)預(yù)處理得到相應(yīng)的分詞序列:P={p0,p1,...,pn-1}和Q={q0,q1,...,qm-1}、分字序列表示:
P={{p11,...,p1l},...,{pi1,...,pil},...,{pn1,...,pnl}}和
Q={{q11,...,q1l},...,{qi1,...,qil},...,{qm1,...,qml}}。
4.根據(jù)權(quán)利要求3所述的基于答案類別和句法指導(dǎo)的案情閱讀理解方法,其特征在于:所述Step2中,在詞嵌入層將文本的分詞序列及分字序列輸入到詞嵌入層分別得詞嵌入和字符詞嵌入;
CiP=E(pi) (1)
CiQ=E(qi) (2)
Ci·P=E(pi) (3)
Ci·Q=E(qi) (4)
其中,表示篇章經(jīng)詞嵌入編碼的詞嵌入,表示問(wèn)題經(jīng)詞嵌入編碼的詞嵌入,表示篇章經(jīng)詞嵌入編碼的字符詞嵌入,表示問(wèn)題經(jīng)詞嵌入編碼的字符詞嵌入;
為了選出詞組中最能代表詞語(yǔ)意思的那個(gè)字,將字符詞嵌入表示做以下處理:
此時(shí)的表示詞語(yǔ)中最能代表詞語(yǔ)意思的那個(gè)字,這個(gè)字表示用來(lái)和詞級(jí)嵌入向量拼接融合作為整個(gè)模型的詞嵌入表示,并且做下一步的字符注意力。
5.根據(jù)權(quán)利要求1所述的基于答案類別和句法指導(dǎo)的案情閱讀理解方法,其特征在于:所述Step5中,在注意力及融合層,通過(guò)問(wèn)題對(duì)篇章的注意力以及篇章自注意力增加與問(wèn)題相關(guān)的信息權(quán)重,然后融合注意力及自注意力結(jié)果。
6.根據(jù)權(quán)利要求1所述的基于答案類別和句法指導(dǎo)的案情閱讀理解方法,其特征在于:所述Step5中,在注意力及融合層,在問(wèn)題對(duì)篇章的注意力之后基于答案標(biāo)簽對(duì)篇章用softmax作二分類,一類為有答案,另一類為無(wú)答案類。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于昆明理工大學(xué),未經(jīng)昆明理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110448963.8/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 用于智能問(wèn)答系統(tǒng)的答案排序方法及裝置
- 一種基于串謀檢測(cè)的眾包結(jié)果匯聚方法及裝置
- 一種面向問(wèn)答領(lǐng)域動(dòng)態(tài)計(jì)算問(wèn)句與答案相似性的方法
- 一種基于數(shù)據(jù)處理的眾包任務(wù)答案確定方法及相關(guān)設(shè)備
- 一種手寫(xiě)答案識(shí)別批改方法及裝置
- 一種答案批改方法及裝置
- 一種面向閱讀理解問(wèn)答的多角度答案驗(yàn)證方法
- 一種訓(xùn)練文本關(guān)鍵內(nèi)容提取模型的方法和系統(tǒng)
- 填空題標(biāo)準(zhǔn)答案確定方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 互動(dòng)游戲書(shū)
- 統(tǒng)計(jì)機(jī)器翻譯
- 具有可擴(kuò)展句法的編程語(yǔ)言
- 一種雙語(yǔ)無(wú)監(jiān)督句法分析方法及系統(tǒng)
- 對(duì)來(lái)自比特流的視頻進(jìn)行解碼的方法和設(shè)備
- 句法解析裝置和句法解析方法
- 基于句法骨架的統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)
- 問(wèn)答檢索方法、問(wèn)答檢索裝置、問(wèn)答檢索設(shè)備及介質(zhì)
- 一種融合短語(yǔ)先驗(yàn)知識(shí)的依存句法分析方法及裝置
- 一種自然語(yǔ)言處理的句法分析方法、智能終端及存儲(chǔ)介質(zhì)
- 一種集成句法信息的嵌套命名實(shí)體識(shí)別方法與系統(tǒng)





