[發(fā)明專利]一種面向知識圖譜問答的復(fù)合問句解析方法有效
| 申請?zhí)枺?/td> | 202010166812.9 | 申請日: | 2020-03-11 |
| 公開(公告)號: | CN111444316B | 公開(公告)日: | 2023-08-29 |
| 發(fā)明(設(shè)計)人: | 陳華鈞;楊帆;楊海宏 | 申請(專利權(quán))人: | 浙江大學(xué) |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/332;G06F16/36;G06N3/0442;G06N3/045;G06N3/048;G06N3/084;G06N3/092 |
| 代理公司: | 杭州天勤知識產(chǎn)權(quán)代理有限公司 33224 | 代理人: | 胡紅娟 |
| 地址: | 310013 浙江*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 面向 知識 圖譜 問答 復(fù)合 問句 解析 方法 | ||
本發(fā)明公開了一種面向知識圖譜問答的復(fù)合問句解析方法,包括:接收復(fù)合問題并獲得中心詞,作為查詢的起點;在解耦器中,將復(fù)合問題分解為多個簡單問題;在關(guān)系檢測器中,計算各個簡單問題與候選關(guān)系的匹配概率,選擇概率最大的關(guān)系作為該簡單問題所屬的關(guān)系,以中心詞為起點、各個簡單問題所屬的關(guān)系為邊,在知識圖譜中進行匹配,得到復(fù)合問題的預(yù)測答案;計算復(fù)合問題的預(yù)測答案與真實答案的損失值,使用優(yōu)化算法迭代求解直至損失值收斂,得到復(fù)合問題的答案。本發(fā)明所述的復(fù)合問句解析方法結(jié)合強化學(xué)習的思想,將復(fù)合問題分解為簡單問題,再通過各個簡單問題的答案組合出原始復(fù)合問題的答案,提升了智能問答系統(tǒng)在回答復(fù)合問題時的表現(xiàn)。
技術(shù)領(lǐng)域
本發(fā)明涉及知識問答系統(tǒng)領(lǐng)域,具體涉及一種面向知識圖譜問答的復(fù)合問句解析方法。
背景技術(shù)
問答系統(tǒng)(Question?Answering?System,QA)是信息檢索系統(tǒng)的一種高級形式,其研究興起的主要原因是人們對快速、準確地獲取信息的需求,問答系統(tǒng)是目前人工智能和自然語言處理領(lǐng)域中一個倍受關(guān)注并具有廣泛發(fā)展前景的研究方向。
面向知識圖譜的智能問答系統(tǒng)(KBQA)在知識圖譜中的大量事實和回答自然語言表示的問題之間搭建了一座橋梁,通過問答系統(tǒng)這個接口,用戶可以輕松地使用自然語言在知識圖譜中查詢問題的答案。
傳統(tǒng)的回答復(fù)合問題的語義解析過程包括兩部分,首先檢測問題中提及的作為主題詞的實體,該實體作為在知識圖譜中查詢的起點,然后尋找由多個關(guān)系組成的路徑,該路徑從主題詞(起點)連接至復(fù)合問題的答案(終點)。
對于知識圖譜搜索空間的組合泛化,許多方法將KBQA定義為一個兩階段的串行任務(wù),包括實體鏈接和關(guān)系檢測;一些研究聚焦于直接對自然語言問題進行語義分析,把問題解析為結(jié)構(gòu)化的查詢,這往往需要大量預(yù)先定義的規(guī)則;另一些研究則更關(guān)注自然語言問題的表示而不是構(gòu)造知識圖譜的查詢。
問答系統(tǒng)中的問題主要分為兩大類,即只包含單一關(guān)系的單跳問題和包含多個關(guān)系的多跳問題,現(xiàn)有關(guān)于智能問答系統(tǒng)的研究大多只關(guān)注單跳問題這種簡單的問題形式。
公開號為CN108153876A公開了一種智能問答方法及系統(tǒng),該智能問答系統(tǒng)(100)包括:對話引擎(101),用于接收用戶提出的問題;分析模塊(102),用于對用戶的問題進行分析;候選問答庫(103);檢索模塊(104),用于基于所述分析模塊(102)對問題分析的結(jié)果,在所述候選問答庫(103)中檢索出與用戶問題相關(guān)的問答對;匹配模塊(105),用于計算所述檢索模塊(104)檢索出的候選問答對與用戶問題的匹配度值;重排序模塊(106),用于綜合考慮問題分析、檢索和匹配獲得的結(jié)果,并結(jié)合業(yè)務(wù)需求,對候選問答對重新排序。所述對話引擎(101)進一步被配置為從所述重排序模塊(106)重新排序的候選問答對中選擇對用戶的答復(fù)。
其中,關(guān)系檢測被認為是KBQA的瓶頸,許多工作嘗試從不同角度去解決該任務(wù),比如設(shè)計豐富的特征、使用深度神經(jīng)網(wǎng)絡(luò)以及加入注意力機制,大多數(shù)方法能夠處理上千個關(guān)系,但是很少有支持多關(guān)系檢測。
基于深度神經(jīng)網(wǎng)絡(luò)的語義角色標注通過學(xué)習對每個單詞進行語義角色標注來捕捉謂詞和參數(shù)之間的依賴性。這些工作注重提高角色分類器的性能,但是仍然需要大量的監(jiān)督信號。
發(fā)明內(nèi)容
本發(fā)明提供了一種面向知識圖譜問答的復(fù)合問句解析方法,該復(fù)合問句解析方法中引入了強化學(xué)習的思想,將復(fù)合問題分解為簡單問題的模型,能夠提升KBQA系統(tǒng)回答復(fù)合問題的表現(xiàn)。
一種面向知識圖譜問答的復(fù)合問句解析方法,包括:
(1)接收客戶提出的復(fù)合問題,獲得復(fù)合問題的中心詞,作為查詢的起點;
(2)將復(fù)合問題分解為多個簡單問題。
所述的復(fù)合問題由N個單詞組成的單詞序列,具體為式(1)所示;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大學(xué),未經(jīng)浙江大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010166812.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于圖譜界面的數(shù)據(jù)處理方法及系統(tǒng)
- 用于內(nèi)容特征圖譜化的特征圖譜布局的服務(wù)器及介質(zhì)
- 圖譜的構(gòu)建方法及裝置、電子設(shè)備
- 信息圖譜構(gòu)建方法、裝置及設(shè)備
- 知識圖譜的完善方法及裝置、數(shù)據(jù)處理方法及裝置
- 一種知識圖譜的構(gòu)建方法、裝置、知識圖譜系統(tǒng)及設(shè)備
- 一種基于知識圖譜的故障判別推理方法
- 一種事件圖譜的匹配方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種用于創(chuàng)建知識圖譜的計算機設(shè)備
- 一種支持增量實體關(guān)聯(lián)的關(guān)系圖譜計算方法





