[發(fā)明專利]問(wèn)答文本的語(yǔ)義匹配方法、裝置、介質(zhì)及電子設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 201811563115.6 | 申請(qǐng)日: | 2018-12-20 |
| 公開(kāi)(公告)號(hào): | CN109726396A | 公開(kāi)(公告)日: | 2019-05-07 |
| 發(fā)明(設(shè)計(jì))人: | 李淵;賀國(guó)秀 | 申請(qǐng)(專利權(quán))人: | 泰康保險(xiǎn)集團(tuán)股份有限公司;泰康在線財(cái)產(chǎn)保險(xiǎn)股份有限公司 |
| 主分類號(hào): | G06F17/27 | 分類號(hào): | G06F17/27;G06F16/332;G06N3/04;G06N3/08 |
| 代理公司: | 隆天知識(shí)產(chǎn)權(quán)代理有限公司 72003 | 代理人: | 章侃銥;李玉鎖 |
| 地址: | 100031 北*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本 特征信息 文本語(yǔ)義 語(yǔ)義匹配 句法結(jié)構(gòu) 全局特征 單詞 匹配 循環(huán)神經(jīng)網(wǎng)絡(luò) 注意力機(jī)制 電子設(shè)備 局部特征 局部語(yǔ)義 句法特征 句法信息 匹配技術(shù) 單一化 有效地 抽取 學(xué)習(xí) | ||
本公開(kāi)提供了一種問(wèn)答文本的語(yǔ)義匹配方法,該方法可以有效地解決相關(guān)技術(shù)中的問(wèn)題。例如,在相關(guān)技術(shù)中基于深度學(xué)習(xí)模型的問(wèn)答文本語(yǔ)義匹配技術(shù),其只能提供上下文局部語(yǔ)義特征信息,缺少背景全局特征信息和問(wèn)答文本的句法特征信息,導(dǎo)致特征單一化,不能完全體現(xiàn)問(wèn)答文本的語(yǔ)義匹配信息。而本發(fā)明提供了一種基于多級(jí)特征和深度學(xué)習(xí)的問(wèn)答文本語(yǔ)義匹配方法,對(duì)問(wèn)答文本的單詞和句法信息進(jìn)行單詞和句法結(jié)構(gòu)分布式表示,并使用循環(huán)神經(jīng)網(wǎng)絡(luò)提取問(wèn)答文本的上下文局部特征信息和句法結(jié)構(gòu)特征信息,然后運(yùn)用注意力機(jī)制抽取背景全局特征信息,使問(wèn)答文本的特征信息更豐富,從而提高問(wèn)答文本語(yǔ)義匹配的準(zhǔn)確性。
技術(shù)領(lǐng)域
本發(fā)明涉及自然語(yǔ)言處理技術(shù)領(lǐng)域,具體而言,涉及一種問(wèn)答文本的語(yǔ)義匹配方法、裝置、介質(zhì)及電子設(shè)備。
背景技術(shù)
目前,基于深度學(xué)習(xí)的問(wèn)答文本語(yǔ)義匹配的方法可以包含以下步驟:基于神經(jīng)網(wǎng)絡(luò)訓(xùn)練的詞嵌入模型對(duì)文本進(jìn)行詞向量表示,其表示語(yǔ)義能力更強(qiáng)。通過(guò)構(gòu)建長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)LSTM(Long Short-Term Memory)或門(mén)控循環(huán)單元GRU(Gated Recurrent Unit)等深度學(xué)習(xí)等模型對(duì)文本建模。雖然這些方法對(duì)特征選取依賴性較低,一定程度上提取了文本淺層語(yǔ)義信息和上下文局部特征,但不能提取大量重點(diǎn)全局特征和句法結(jié)構(gòu)特征,因此降低了問(wèn)答文本語(yǔ)義匹配的準(zhǔn)確性。
需要說(shuō)明的是,在上述背景技術(shù)部分公開(kāi)的信息僅用于加強(qiáng)對(duì)本發(fā)明的背景的理解,因此可以包括不構(gòu)成對(duì)本領(lǐng)域普通技術(shù)人員已知的現(xiàn)有技術(shù)的信息。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例的目的在于提供一種問(wèn)答文本的語(yǔ)義匹配方法、裝置、介質(zhì)及電子設(shè)備,進(jìn)而至少可以在一定程度上克服問(wèn)答文本語(yǔ)義匹配的準(zhǔn)確性較低的問(wèn)題。
本發(fā)明的其他特性和優(yōu)點(diǎn)將通過(guò)下面的詳細(xì)描述變得顯然,或部分地通過(guò)本發(fā)明的實(shí)踐而習(xí)得。
根據(jù)本發(fā)明實(shí)施例的第一方面,提供了一種問(wèn)答文本的語(yǔ)義匹配方法,包括:利用循環(huán)神經(jīng)網(wǎng)絡(luò)獲取問(wèn)題文本的具有上下文局部特征和句法結(jié)構(gòu)特征的多級(jí)特征向量序列,以及獲取候選答案文本的具有上下文局部特征和句法結(jié)構(gòu)特征的多級(jí)特征向量序列;基于所述問(wèn)題文本的具有上下文局部特征和句法結(jié)構(gòu)特征的多級(jí)特征向量序列和所述問(wèn)題文本的具有上下文局部特征和句法結(jié)構(gòu)特征的多級(jí)特征向量序列中每個(gè)特征向量的注意力權(quán)重,生成所述問(wèn)題文本的具有上下文局部特征、句法結(jié)構(gòu)特征的和全局特征的特征向量,以及基于所述候選答案文本的具有上下文局部特征和句法結(jié)構(gòu)特征的多級(jí)特征向量序列和所述候選答案文本的具有上下文局部特征和句法結(jié)構(gòu)特征的多級(jí)特征向量序列中每個(gè)特征向量的注意力權(quán)重,生成所述候選答案文本的具有上下文局部特征、句法結(jié)構(gòu)特征的和全局特征的特征向量;根據(jù)所述問(wèn)題文本的具有上下文局部特征、句法結(jié)構(gòu)特征的和全局特征的特征向量和所述候選答案文本的具有上下文局部特征、句法結(jié)構(gòu)特征的和全局特征的特征向量,確定所述問(wèn)題文本與所述候選答案文本的語(yǔ)義匹配度。
在本發(fā)明的一些實(shí)施例中,在利用循環(huán)神經(jīng)網(wǎng)絡(luò)獲取問(wèn)題文本的具有上下文局部特征和句法結(jié)構(gòu)特征的多級(jí)特征向量序列,以及獲取候選答案文本的具有上下文局部特征和句法結(jié)構(gòu)特征的多級(jí)特征向量序列之前,該方法還包括:根據(jù)知識(shí)庫(kù)問(wèn)答文本語(yǔ)料構(gòu)建專業(yè)問(wèn)答詞典;根據(jù)所述專業(yè)問(wèn)答詞典對(duì)所述問(wèn)題文本和所述候選答案文本進(jìn)行分析,得到所述問(wèn)題文本的單詞、所述問(wèn)題文本的句法結(jié)構(gòu)和所述候選答案文本的單詞、所述候選答案文本的句法結(jié)構(gòu);對(duì)所述問(wèn)題文本的單詞、所述問(wèn)題文本的句法結(jié)構(gòu)和所述候選答案文本的單詞、所述候選答案文本的句法結(jié)構(gòu)分別進(jìn)行分布式表示,得到問(wèn)題文本的詞向量和句法結(jié)構(gòu)向量組成的向量序列和候選答案文本的詞向量和句法結(jié)構(gòu)向量組成的向量序列。
在本發(fā)明的一些實(shí)施例中,基于前述方案,所述循環(huán)神經(jīng)網(wǎng)絡(luò)包括雙向循環(huán)神經(jīng)網(wǎng)絡(luò),所述雙向循環(huán)神經(jīng)網(wǎng)絡(luò)中的循環(huán)神經(jīng)網(wǎng)絡(luò)包括基于長(zhǎng)短時(shí)記憶LSTM和/或基于門(mén)控循環(huán)單元GRU的網(wǎng)絡(luò)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于泰康保險(xiǎn)集團(tuán)股份有限公司;泰康在線財(cái)產(chǎn)保險(xiǎn)股份有限公司,未經(jīng)泰康保險(xiǎn)集團(tuán)股份有限公司;泰康在線財(cái)產(chǎn)保險(xiǎn)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811563115.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 一種基于深度學(xué)習(xí)的文本語(yǔ)義特征生成優(yōu)化方法
- 一種中醫(yī)病情文本相似度的計(jì)算方法
- 一種分布式的文本近似最近鄰語(yǔ)義搜索計(jì)算方法
- 短文本的推薦方法、裝置、介質(zhì)及電子設(shè)備
- 基于文本語(yǔ)義映射的跨模態(tài)數(shù)據(jù)檢索系統(tǒng)及其檢索方法
- 文本語(yǔ)義識(shí)別方法及其模型的獲取方法及相關(guān)裝置
- 一種語(yǔ)義理解方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種語(yǔ)義識(shí)別方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 融合深度特征和時(shí)序模型的語(yǔ)義情感分析方法
- 一種目標(biāo)文本提取方法及系統(tǒng)
- 一種融合對(duì)象語(yǔ)義的商標(biāo)圖像匹配方法
- 語(yǔ)義消歧處理方法、裝置及其設(shè)備
- 圖像特征的匹配、定位方法及裝置、定位系統(tǒng)
- 一種基于幾何一致性的圖像語(yǔ)義特征匹配方法
- 面向大數(shù)據(jù)文本挖掘的動(dòng)態(tài)認(rèn)知語(yǔ)義匹配方法
- 一種語(yǔ)義匹配方法及裝置
- 語(yǔ)義匹配方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種語(yǔ)義匹配、語(yǔ)義相似度模型訓(xùn)練方法及裝置
- 一種通用的語(yǔ)義匹配實(shí)現(xiàn)方法與系統(tǒng)
- 一種基于特征樹(shù)的語(yǔ)義匹配問(wèn)答方法及系統(tǒng)





