[發(fā)明專利]基于雙向注意力機(jī)制的答案選擇方法、裝置和電子設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 201810619458.3 | 申請(qǐng)日: | 2018-06-12 |
| 公開(公告)號(hào): | CN108845990A | 公開(公告)日: | 2018-11-20 |
| 發(fā)明(設(shè)計(jì))人: | 楊鵬 | 申請(qǐng)(專利權(quán))人: | 北京慧聞科技發(fā)展有限公司 |
| 主分類號(hào): | G06F17/27 | 分類號(hào): | G06F17/27;G06F17/30;G06N3/04;G06N3/08 |
| 代理公司: | 北京睿邦知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11481 | 代理人: | 徐丁峰 |
| 地址: | 100000 北京市西城區(qū)西*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 答案數(shù)據(jù) 問題數(shù)據(jù) 答案選擇 詞向量 注意力機(jī)制 電子設(shè)備 關(guān)系矩陣 特征表示 狀態(tài)序列 卷積神經(jīng)網(wǎng)絡(luò) 錯(cuò)誤答案 模型構(gòu)架 模型獲得 正確答案 概率 申請(qǐng) 轉(zhuǎn)化 | ||
本申請(qǐng)涉及基于雙向注意力機(jī)制的用于答案選擇的方法、裝置和電子設(shè)備。該方法包括:對(duì)獲取的問題數(shù)據(jù)和答案數(shù)據(jù)進(jìn)行詞向量轉(zhuǎn)化以分別獲得所述問題數(shù)據(jù)和所述答案數(shù)據(jù)的詞向量表示;處理所述問題數(shù)據(jù)和所述答案數(shù)據(jù)的詞向量表示以分別獲得所述問題數(shù)據(jù)和所述答案數(shù)據(jù)的隱狀態(tài)序列;處理所述問題數(shù)據(jù)和所述答案數(shù)據(jù)的隱狀態(tài)序列以獲得所述問題數(shù)據(jù)和所述答案數(shù)據(jù)之間的關(guān)系矩陣;通過卷積神經(jīng)網(wǎng)絡(luò)模型獲得所述關(guān)系矩陣的特征表示;以及,處理所述特征表示以分別獲得所述答案數(shù)據(jù)為所述問題數(shù)據(jù)的正確答案的第一概率值和所述答案數(shù)據(jù)為所述問題數(shù)據(jù)的錯(cuò)誤答案的第二概率值。這樣,通過特定模型構(gòu)架,提升所述答案選擇系統(tǒng)的準(zhǔn)確性。
技術(shù)領(lǐng)域
本發(fā)明總體地涉及數(shù)據(jù)處理領(lǐng)域,且更為具體地,涉及一種基于雙向注意力機(jī)制的用于答案選擇的方法、裝置和電子設(shè)備。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,越來越多的人選擇在網(wǎng)上搜索問題,并獲取與問題相關(guān)的答案。常見地,網(wǎng)民可以通過社區(qū)問答系統(tǒng)(Community-based Question Answering),例如百度知道,知乎、Stack Overflow等,檢索自己想了解的問題,并獲取與問題相關(guān)的滿意答案。
答案選擇系統(tǒng)正是基于這樣的背景應(yīng)運(yùn)而生,其目的在于幫助用戶快速且準(zhǔn)確地獲取與問題相關(guān)的正確答案。
在答案選擇系統(tǒng)中應(yīng)用了大量的算法,并發(fā)揮著巨大的作用,其中不少算法的應(yīng)用非常成功,應(yīng)用領(lǐng)域也很廣。但是,這些算法也在不同方面,例如魯棒性、可預(yù)測(cè)性方面存在不足。
因此,需要改進(jìn)的用于答案選擇系統(tǒng)的數(shù)據(jù)處理方案。
發(fā)明內(nèi)容
為了解決上述技術(shù)問題,提出了本申請(qǐng)。本申請(qǐng)的實(shí)施例提供了一種基于雙向注意力機(jī)制的用于答案選擇的方法、裝置和電子設(shè)備,其充分考慮問題和答案之間的聯(lián)系,并通過特定模型架構(gòu)提升答案選擇系統(tǒng)的準(zhǔn)確性。
根據(jù)本申請(qǐng)的一方面,提供了一種基于雙向注意力機(jī)制的用于答案選擇的方法,包括:對(duì)獲取的問題數(shù)據(jù)和答案數(shù)據(jù)分別進(jìn)行詞向量轉(zhuǎn)化,以分別獲得所述問題數(shù)據(jù)的詞向量表示和所述答案數(shù)據(jù)的詞向量表示;通過雙向長(zhǎng)短期記憶層分別處理所述問題數(shù)據(jù)的詞向量表示和所述答案數(shù)據(jù)的詞向量表示,以分別獲得所述問題數(shù)據(jù)的隱狀態(tài)序列和所述答案數(shù)據(jù)的隱狀態(tài)序列;以交互層處理所述問題數(shù)據(jù)的隱狀態(tài)序列和所述答案數(shù)據(jù)的隱狀態(tài)序列,以獲得所述問題數(shù)據(jù)的詞語和所述答案數(shù)據(jù)的詞語之間的關(guān)系矩陣;通過卷積神經(jīng)網(wǎng)絡(luò)模型處理所述關(guān)系矩陣,以獲得所述關(guān)系矩陣的特征表示;以用于二元分類的邏輯回歸模型處理所述特征表示,以分別獲得所述答案數(shù)據(jù)為所述問題數(shù)據(jù)的正確答案的第一概率值和所述答案數(shù)據(jù)為所述問題數(shù)據(jù)的錯(cuò)誤答案的第二概率值。
在上述基于雙向注意力機(jī)制的用于答案選擇的方法中,在獲得所述第一概率值和所述第二概率值之后進(jìn)一步包括:判定所述第一概率值是否大于預(yù)定閾值;以及,響應(yīng)于所述第一概率值大于所述預(yù)定閾值,確定所述答案數(shù)據(jù)為所述問題數(shù)據(jù)的正確答案。
在上述基于雙向注意力機(jī)制的用于答案選擇的方法中,所述卷積神經(jīng)網(wǎng)絡(luò)模型為稠密卷積神經(jīng)網(wǎng)絡(luò)模型。
在上述基于雙向注意力機(jī)制的用于答案選擇的方法中,獲得所述問題數(shù)據(jù)的隱狀態(tài)序列和所述答案數(shù)據(jù)的隱狀態(tài)序列之間的關(guān)系矩陣,包括:
將所述問題數(shù)據(jù)的隱狀態(tài)序列和所述答案數(shù)據(jù)的隱狀態(tài)序列進(jìn)行向量點(diǎn)乘以獲得所述關(guān)系矩陣。
在上述基于雙向注意力機(jī)制的用于答案選擇的方法中,進(jìn)一步地包括:計(jì)算對(duì)應(yīng)的損失函數(shù)以通過反向傳播調(diào)整用于答案選擇的系統(tǒng)的網(wǎng)絡(luò)參數(shù)。
在上述基于雙向注意力機(jī)制的用于答案選擇的方法中,在調(diào)整所述用于答案選擇的系統(tǒng)的網(wǎng)絡(luò)參數(shù)的過程中,針對(duì)所述問題數(shù)據(jù)隨機(jī)采樣的多個(gè)錯(cuò)誤答案樣本數(shù)據(jù)中與所述問題數(shù)據(jù)相似度得分最高的錯(cuò)誤答案被設(shè)置為所述損失函數(shù)的輸入。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京慧聞科技發(fā)展有限公司,未經(jīng)北京慧聞科技發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810619458.3/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種基于樹的遍歷技術(shù)的試題答案快速保存和裝載方法
- 搜索中的直接答案觸發(fā)
- 基于雙向注意力機(jī)制的答案選擇方法、裝置和電子設(shè)備
- 基于交叉注意力神經(jīng)網(wǎng)絡(luò)的答案選擇方法、裝置和電子設(shè)備
- 基于機(jī)器學(xué)習(xí)的問答數(shù)據(jù)處理方法、裝置和計(jì)算機(jī)設(shè)備
- 一種問答對(duì)數(shù)據(jù)的挖掘方法、裝置及電子設(shè)備
- 答案質(zhì)量確定模型訓(xùn)練方法、答案質(zhì)量確定方法及裝置
- 一種多媒體答案生成方法、裝置、終端設(shè)備以及存儲(chǔ)介質(zhì)
- 基于客戶端的答題提示方法、系統(tǒng)及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 用于問答系統(tǒng)的答案擴(kuò)展方法、裝置及電子設(shè)備
- 來自不可轉(zhuǎn)錄數(shù)據(jù)的診斷識(shí)別問題
- 一種基于測(cè)量上報(bào)數(shù)據(jù)定位工參問題和干擾問題的方法
- 數(shù)據(jù)問題處理方法和處理系統(tǒng)
- 數(shù)據(jù)業(yè)務(wù)問題定位的方法及裝置
- 智能處理問題數(shù)據(jù)的方法和系統(tǒng)
- 地圖數(shù)據(jù)的問題處理方法及裝置
- 使用質(zhì)詢問題檢驗(yàn)地圖數(shù)據(jù)
- 解決數(shù)據(jù)傾斜問題的方法及裝置
- IEMS數(shù)據(jù)問題排查系統(tǒng)及方法
- 保護(hù)數(shù)據(jù)隱私的選擇問題處理方法





