[發(fā)明專(zhuān)利]基于大數(shù)據(jù)的答案位置獲取方法、裝置、設(shè)備及介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202010037661.7 | 申請(qǐng)日: | 2020-01-14 |
| 公開(kāi)(公告)號(hào): | CN111241244A | 公開(kāi)(公告)日: | 2020-06-05 |
| 發(fā)明(設(shè)計(jì))人: | 陳楨博;金戈;徐亮 | 申請(qǐng)(專(zhuān)利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類(lèi)號(hào): | G06F16/33 | 分類(lèi)號(hào): | G06F16/33;G06F16/332 |
| 代理公司: | 深圳眾鼎專(zhuān)利商標(biāo)代理事務(wù)所(普通合伙) 44325 | 代理人: | 張美君 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 數(shù)據(jù) 答案 位置 獲取 方法 裝置 設(shè)備 介質(zhì) | ||
本發(fā)明公開(kāi)了一種基于大數(shù)據(jù)的答案位置獲取方法,包括:執(zhí)行向量化,得到待處理的文本信息對(duì)應(yīng)的詞向量和問(wèn)題信息對(duì)應(yīng)的詞向量;通過(guò)Bi?LSTM網(wǎng)絡(luò)對(duì)所述問(wèn)題信息對(duì)應(yīng)的詞向量進(jìn)行特征提取及壓縮維度,得到問(wèn)題編碼信息;對(duì)文本信息中的每一個(gè)詞向量添加位置向量和所述問(wèn)題編碼信息,得到文本編碼信息;通過(guò)預(yù)設(shè)的多層卷積層對(duì)所述文本編碼信息進(jìn)行特征提取,得到文本編碼信息對(duì)應(yīng)的文本特征信息;通過(guò)Bi?LSTM網(wǎng)絡(luò)對(duì)所述文本特征信息進(jìn)行序列標(biāo)注,得到文本信息中每一個(gè)詞的第一概率與第二概率;獲取第一概率最大值對(duì)應(yīng)的詞作為答案開(kāi)始位置和第二概率最大值對(duì)應(yīng)的詞作為答案結(jié)束位置。本發(fā)明解決了現(xiàn)有問(wèn)答模型的參數(shù)量大、算法訓(xùn)練耗時(shí)長(zhǎng)的問(wèn)題。
技術(shù)領(lǐng)域
本發(fā)明涉及信息技術(shù)領(lǐng)域,尤其涉及一種基于大數(shù)據(jù)的答案位置獲取方法、裝置、設(shè)備及介質(zhì)。
背景技術(shù)
現(xiàn)有的問(wèn)答模型主要通過(guò)循環(huán)神經(jīng)網(wǎng)絡(luò)或者較為復(fù)雜的深度學(xué)習(xí)語(yǔ)言模型實(shí)現(xiàn)。然而,循環(huán)神經(jīng)網(wǎng)絡(luò)的算法精度有限,模型無(wú)法進(jìn)行并行計(jì)算,從而需要較長(zhǎng)的訓(xùn)練耗時(shí)。盡管深度學(xué)習(xí)語(yǔ)言模型允許并行計(jì)算,也已經(jīng)能夠取得較高的精度,但是由于語(yǔ)言模型能夠應(yīng)對(duì)多種自然語(yǔ)言處理任務(wù),模型結(jié)構(gòu)復(fù)雜且參數(shù)量較為龐大,同樣需要較長(zhǎng)的訓(xùn)練耗時(shí)??梢?jiàn),不管是基于循環(huán)神經(jīng)網(wǎng)絡(luò)還是深度學(xué)習(xí)語(yǔ)言模型的問(wèn)答模型,都存在算法訓(xùn)練耗時(shí)較長(zhǎng)的缺點(diǎn),無(wú)法構(gòu)建輕量化的問(wèn)答模型。
因此,尋找一種解決現(xiàn)有問(wèn)答模型的參數(shù)量大、算法訓(xùn)練耗時(shí)長(zhǎng)的方法成為本領(lǐng)域技術(shù)人員亟需解決的技術(shù)問(wèn)題。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種基于大數(shù)據(jù)的答案位置獲取方法、裝置、設(shè)備及介質(zhì),以解決現(xiàn)有問(wèn)答模型的參數(shù)量大、算法訓(xùn)練耗時(shí)長(zhǎng)的問(wèn)題。
一種基于大數(shù)據(jù)的答案位置獲取方法,包括:
獲取待處理的文本信息和問(wèn)題信息,分別對(duì)所述文本信息和問(wèn)題信息中的每一個(gè)詞執(zhí)行向量化,得到所述文本信息對(duì)應(yīng)的詞向量和問(wèn)題信息對(duì)應(yīng)的詞向量;
通過(guò)雙向循環(huán)神經(jīng)網(wǎng)絡(luò)Bi-LSTM對(duì)所述問(wèn)題信息對(duì)應(yīng)的詞向量進(jìn)行特征提取,并對(duì)提取得到的多維特征矩陣壓縮至預(yù)設(shè)維度,得到問(wèn)題編碼信息;
對(duì)文本信息中的每一個(gè)詞向量添加位置向量和所述問(wèn)題編碼信息,得到所述文本信息對(duì)應(yīng)的文本編碼信息;
通過(guò)預(yù)設(shè)的多層卷積層對(duì)所述文本編碼信息進(jìn)行特征提取,得到所述文本信息對(duì)應(yīng)的文本特征信息;
通過(guò)雙向循環(huán)神經(jīng)網(wǎng)絡(luò)Bi-LSTM對(duì)所述文本特征信息進(jìn)行序列標(biāo)注,得到文本信息中每一個(gè)詞的第一概率與第二概率;
獲取第一概率最大值對(duì)應(yīng)的詞作為答案開(kāi)始位置和第二概率最大值對(duì)應(yīng)的詞作為答案結(jié)束位置。
進(jìn)一步地,所述通過(guò)雙向循環(huán)神經(jīng)網(wǎng)絡(luò)Bi-LSTM對(duì)所述問(wèn)題信息對(duì)應(yīng)的詞向量進(jìn)行特征提取,并對(duì)提取得到的多維特征矩陣壓縮至預(yù)設(shè)維度,得到問(wèn)題編碼信息包括:
通過(guò)雙向循環(huán)神經(jīng)網(wǎng)絡(luò)Bi-LSTM對(duì)所述問(wèn)題信息對(duì)應(yīng)的詞向量進(jìn)行特征提取,得到m*n維特征矩陣;
通過(guò)加性注意力機(jī)制,將所述m*n維特征矩陣壓縮至1*n維特征矩陣;
通過(guò)預(yù)設(shè)的全連接層,將所述1*n維特征矩轉(zhuǎn)化為1*k維特征矩陣,以所述1*k維特征矩陣作為問(wèn)題編碼信息。
進(jìn)一步地,所述對(duì)文本信息中的每一個(gè)詞向量添加位置向量和所述問(wèn)題編碼信息,得到所述文本信息對(duì)應(yīng)的文本編碼信息包括:
對(duì)文本信息中的每一個(gè)詞向量,通過(guò)預(yù)設(shè)的正弦函數(shù)和余弦函數(shù)生成所述詞向量對(duì)應(yīng)的位置向量;
將所述位置向量、問(wèn)題編碼信息依次添加至所述詞向量之后,得到所述詞向量對(duì)應(yīng)的文本編碼信息。
進(jìn)一步地,所述通過(guò)預(yù)設(shè)的多層卷積層對(duì)所述文本編碼信息進(jìn)行特征提取,得到所述文本信息對(duì)應(yīng)的文本特征信息包括:
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010037661.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 用于智能問(wèn)答系統(tǒng)的答案排序方法及裝置
- 一種基于串謀檢測(cè)的眾包結(jié)果匯聚方法及裝置
- 一種面向問(wèn)答領(lǐng)域動(dòng)態(tài)計(jì)算問(wèn)句與答案相似性的方法
- 一種基于數(shù)據(jù)處理的眾包任務(wù)答案確定方法及相關(guān)設(shè)備
- 一種手寫(xiě)答案識(shí)別批改方法及裝置
- 一種答案批改方法及裝置
- 一種面向閱讀理解問(wèn)答的多角度答案驗(yàn)證方法
- 一種訓(xùn)練文本關(guān)鍵內(nèi)容提取模型的方法和系統(tǒng)
- 填空題標(biāo)準(zhǔn)答案確定方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 互動(dòng)游戲書(shū)
- 位置檢測(cè)裝置、位置檢測(cè)電路及位置檢測(cè)方法
- 位置估計(jì)設(shè)備、位置估計(jì)方法、以及位置估計(jì)系統(tǒng)
- 位置檢測(cè)裝置、位置檢測(cè)方法及位置檢測(cè)程序
- 位置辨識(shí)裝置、位置辨識(shí)系統(tǒng)以及位置辨識(shí)方法
- 位置指示器、位置檢測(cè)裝置、位置檢測(cè)電路以及位置檢測(cè)方法
- 位置檢測(cè)裝置、位置檢測(cè)系統(tǒng)以及位置檢測(cè)方法
- 位置檢測(cè)裝置、位置檢測(cè)系統(tǒng)以及位置檢測(cè)方法
- 位置檢測(cè)裝置、位置檢測(cè)方法以及位置檢測(cè)系統(tǒng)
- 位置估計(jì)方法、位置估計(jì)裝置、以及位置估計(jì)系統(tǒng)
- 位置檢測(cè)方法、位置檢測(cè)裝置以及位置檢測(cè)系統(tǒng)





