[發(fā)明專利]一種多粒度注意力機(jī)制的知識(shí)庫問答關(guān)系檢測(cè)方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 202010904078.1 | 申請(qǐng)日: | 2020-09-01 |
| 公開(公告)號(hào): | CN112100348A | 公開(公告)日: | 2020-12-18 |
| 發(fā)明(設(shè)計(jì))人: | 何儒漢;唐嬌;陳佳;彭濤;張自力;陳常念;劉軍平;胡新榮 | 申請(qǐng)(專利權(quán))人: | 武漢紡織大學(xué) |
| 主分類號(hào): | G06F16/332 | 分類號(hào): | G06F16/332;G06F40/30;G06F40/295;G06N3/04 |
| 代理公司: | 北京金智普華知識(shí)產(chǎn)權(quán)代理有限公司 11401 | 代理人: | 楊采良 |
| 地址: | 430200 湖北省武漢市*** | 國(guó)省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 粒度 注意力 機(jī)制 知識(shí)庫 問答 關(guān)系 檢測(cè) 方法 系統(tǒng) | ||
本發(fā)明屬于網(wǎng)絡(luò)信息數(shù)據(jù)處理技術(shù)領(lǐng)域,公開了一種多粒度注意力機(jī)制的知識(shí)庫問答關(guān)系檢測(cè)方法及系統(tǒng),將端到端的思想應(yīng)用在了知識(shí)庫問答領(lǐng)域,把知識(shí)庫問答問題與先進(jìn)計(jì)算機(jī)技術(shù)相結(jié)合,從多個(gè)粒度對(duì)問題和知識(shí)庫關(guān)系的相關(guān)性進(jìn)行了建模。使用Glove算法將問題和候選關(guān)系轉(zhuǎn)換成詞嵌入,從詞級(jí)、關(guān)系級(jí)兩種粒度建立關(guān)系表示以獲取豐富的關(guān)系語義,并引入注意機(jī)制實(shí)現(xiàn)關(guān)系檢測(cè)中字符之間的細(xì)粒度對(duì)齊,計(jì)算問題向量和候選關(guān)系向量的語義相似性,語義相似性最高的候選關(guān)系所連接的答案即為正確答案。本發(fā)明繞開了最困難的問句理解步驟,并在向量空間模型中保留了豐富的語義信息,使得知識(shí)庫問答的準(zhǔn)確率得到了提高。
技術(shù)領(lǐng)域
本發(fā)明屬于網(wǎng)絡(luò)信息數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種多粒度注意力機(jī)制的知識(shí)庫問答關(guān)系檢測(cè)方法及系統(tǒng)。
背景技術(shù)
目前,隨著互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,網(wǎng)絡(luò)信息數(shù)據(jù)指數(shù)式增長(zhǎng)。在信息大數(shù)據(jù)時(shí)代,在面對(duì)海量的信息時(shí),如何迅速準(zhǔn)確地獲取所需要的信息是用戶的迫切需求。知識(shí)庫問答(Knowledge Base Question Answer)使人們能夠使用自然語言查詢知識(shí)庫,并提供了一種可行的信息獲取方式,具有重大的實(shí)際應(yīng)用價(jià)值,不僅能夠快速準(zhǔn)確地找到信息可以讓人們的生活變得非常便利,例如:查詢天氣,股票價(jià)格,飛機(jī)航班情況等,而且可以部分的代替人工勞動(dòng),大大減少企業(yè)的人力成本,例如:替代人工客服對(duì)客戶進(jìn)行自動(dòng)回答。
知識(shí)庫問答系統(tǒng)通過從KB元組獲取信息來回答問題,對(duì)于輸入問題,這些系統(tǒng)通常生成一個(gè)KB查詢,可以執(zhí)行該查詢從KB檢索答案。涉及兩個(gè)子任務(wù):確定問題中提到的主題實(shí)體和檢測(cè)從主題實(shí)體到答案的關(guān)系路徑,即實(shí)體鏈接和關(guān)系檢測(cè),關(guān)系檢測(cè)在KBQA中起著至關(guān)重要的作用。現(xiàn)有的KBQA方法大多遵循編碼—比較框架,它們將問題和知識(shí)庫事實(shí)映射到一個(gè)公共的嵌入空間,在該空間中,可以方便地計(jì)算問題向量和事實(shí)向量之間的相似度,由于關(guān)系表達(dá)的模糊性和語義多樣性,因此檢測(cè)困難。據(jù)報(bào)道,大多數(shù)錯(cuò)誤的答案是由關(guān)系檢測(cè)造成的。
通過上述分析,現(xiàn)有技術(shù)存在的問題及缺陷為:
語義解析:該方法是一種偏linguistic的方法,主體思想是將自然語言轉(zhuǎn)化為一系列形式化的邏輯形式,通過對(duì)邏輯形式進(jìn)行自底向上的解析,得到一種可以表達(dá)整個(gè)問題語義的邏輯形式,通過相應(yīng)的查詢語句在知識(shí)庫中進(jìn)行查詢,從而得出答案。基于語義解析的方法雖然比較符合人類的直覺,但是需要依賴較多的人工標(biāo)注數(shù)據(jù)和模板,缺乏靈活性和通用性。
信息抽取:該類方法通過提取問題中的實(shí)體,通過在知識(shí)庫中查詢?cè)搶?shí)體可以得到以該實(shí)體節(jié)點(diǎn)為中心的知識(shí)庫子圖,子圖中的每一個(gè)節(jié)點(diǎn)或邊都可以作為候選答案,通過觀察問題依據(jù)某些規(guī)則或模板進(jìn)行信息抽取,得到問題特征向量,建立分類器通過輸入問題特征向量對(duì)候選答案進(jìn)行篩選,從而得出最終答案,缺點(diǎn)是比較依賴人工模板和先驗(yàn)知識(shí)。
向量建模:首先使用一個(gè)n-gram的問題文本生成一組候選的知識(shí)庫事實(shí),然后通過實(shí)體檢測(cè)找到問題中的實(shí)體,與該實(shí)體相關(guān)的關(guān)系構(gòu)成關(guān)系候選,通過一個(gè)深層神經(jīng)網(wǎng)絡(luò)將候選問題和關(guān)系名稱映射到一個(gè)公共的嵌入空間中,然后進(jìn)行向量比較來度量它們之間的語義相似度。但這種方法有兩個(gè)缺陷:(1)編碼嵌入向量只能捕捉到語義信息,失去了原有的詞語交互信息;(2)當(dāng)使用神經(jīng)網(wǎng)絡(luò)將問題或關(guān)系編碼成一個(gè)向量序列時(shí),在計(jì)算語義相似度之前向量序列必須合并成固定維向量,此時(shí)一些重要信息可能會(huì)丟失。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢紡織大學(xué),未經(jīng)武漢紡織大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010904078.1/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 基于粒子濾波視覺注意力模型的運(yùn)動(dòng)目標(biāo)檢測(cè)方法
- 一種評(píng)測(cè)注意力狀態(tài)的方法及裝置
- 注意力測(cè)評(píng)方法、系統(tǒng)及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 兒童注意力評(píng)估系統(tǒng)及其方法
- 一種注意力檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種注意力識(shí)別方法和裝置
- 一種可靠的用戶注意力監(jiān)測(cè)估計(jì)表示模型
- 注意力特征圖獲取方法及裝置、目標(biāo)檢測(cè)的方法及裝置
- 基于通道增強(qiáng)的雙注意力生成對(duì)抗網(wǎng)絡(luò)及圖像生成方法
- 一種文本情感分析模型的優(yōu)化方法及裝置
- 一種機(jī)制蛋的制造方法
- 手機(jī)制式的校準(zhǔn)方法、系統(tǒng)及手機(jī)檢測(cè)設(shè)備
- 一種考慮激勵(lì)機(jī)制電量電價(jià)彈性矩陣的耗電量估測(cè)方法
- 選擇區(qū)塊鏈共識(shí)機(jī)制的方法、裝置以及共識(shí)節(jié)點(diǎn)
- 一種復(fù)合改性機(jī)制砂及其制備方法
- 一種存儲(chǔ)設(shè)備糾錯(cuò)方法及糾錯(cuò)裝置
- 區(qū)塊鏈中共識(shí)機(jī)制的處理方法、裝置和電子設(shè)備
- 一種建筑用機(jī)制砂整形裝置
- 通信方法、通信裝置及存儲(chǔ)介質(zhì)
- 一種網(wǎng)絡(luò)預(yù)約出租車市場(chǎng)準(zhǔn)入機(jī)制的優(yōu)化方法及系統(tǒng)
- 一種專利文本自動(dòng)分析的系統(tǒng)及方法
- 基于知識(shí)的故障恢復(fù)支持系統(tǒng)
- 一種鐵磁諧振故障知識(shí)庫構(gòu)建方法
- 融合知識(shí)庫處理方法和裝置,以及知識(shí)庫管理系統(tǒng)
- 一種基于病理生理路徑的臨床知識(shí)庫系統(tǒng)
- 一種面向網(wǎng)絡(luò)安全的知識(shí)庫構(gòu)建方法
- 基于多知識(shí)庫推理的數(shù)據(jù)匹配決策方法及系統(tǒng)
- 一種語義知識(shí)庫構(gòu)建方法
- 基于人工智能的知識(shí)庫生成方法和智能機(jī)器人應(yīng)答方法
- 知識(shí)點(diǎn)存儲(chǔ)方法、裝置、服務(wù)器及介質(zhì)





