[發(fā)明專利]一種基于交互的知識圖譜問答Q/A系統(tǒng)檢索提升方法和裝置有效
| 申請?zhí)枺?/td> | 201710620427.5 | 申請日: | 2017-07-26 |
| 公開(公告)號: | CN107451240B | 公開(公告)日: | 2019-12-13 |
| 發(fā)明(設計)人: | 張欣勃;鄒磊 | 申請(專利權)人: | 北京大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/36 |
| 代理公司: | 11138 北京三高永信知識產(chǎn)權代理有限責任公司 | 代理人: | 江崇玉 |
| 地址: | 100871*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 交互 知識 圖譜 問答 系統(tǒng) 檢索 提升 方法 裝置 | ||
本公開是關于一種基于交互的知識圖譜問答Q/A系統(tǒng)檢索提升方法和裝置,屬于軟件技術領域。所述方法包括:通過Q/A系統(tǒng)將用戶輸入的目標問題映射成BGP圖,基于BGP圖生成并展示回答信息;獲取用戶針對回答信息輸入的正確答案;確定與正確答案相應的答案圖,其中,答案圖由以正確答案為主體,向外圍擴展的預設數(shù)量以內(nèi)的邊涉及的多個三元組實體所構(gòu)成,邊為三元組實體包含的邊;基于多種預設的修改方式,分別對BGP圖進行預定次數(shù)內(nèi)的修改,得到多個修改BGP圖;在多個修改BGP圖中確定與答案圖相匹配的目標修改BGP圖,基于目標修改BGP圖,對目標問題包含的短語在映射詞典中對應的三元組實體進行修改,其中,映射詞典用于存儲短語與三元組實體的對應關系。
技術領域
本公開是關于軟件技術領域,尤其是關于一種基于交互的知識圖譜問答Q/A系統(tǒng)檢索提升方法和裝置。
背景技術
在當前的網(wǎng)絡信息時代,人們的生活離不開在萬維網(wǎng)上的搜索和查找。隨著網(wǎng)絡信息規(guī)模的爆發(fā)式增長,大量冗余、重復、不可信、不相關的網(wǎng)絡信息難以滿足用戶的需求,于是具有完整知識體系的“知識庫”應運而生。用戶可以順應著人類自然語言的問答習慣,在“知識庫”中的知識圖譜Q/A(Question/Answering,問/答)系統(tǒng)中“問出”自己需要的信息。例如,用戶輸入問題“Which actress was born in countries in Europe(有哪些女演員出生在歐洲)?”,Q/A系統(tǒng)可以將上述問題映射到Q/A系統(tǒng)可以識別的三元組實體,針對三元組實體在“知識庫”中查找并返回對應問題的信息如“Elizabeth Taylor(伊麗莎白〃泰勒)”。
“知識庫”的底層數(shù)據(jù)結(jié)構(gòu)為RDF(Resource Description Framework,資源描述框架),一系列的RDF數(shù)據(jù)的集合為RDF數(shù)據(jù)集,RDF數(shù)據(jù)集就構(gòu)成了“知識庫”。一個RDF數(shù)據(jù)可以視作為一條三元組實體,任一三元組實體可以由主體、謂詞和客體構(gòu)成,以“<主體,謂詞,客體>”的形式表示主體和客體之間的關系,或任一三元組實體可以由主體、屬性、屬性值構(gòu)成,以“<主體,屬性,屬性值>”的形式表示主體的屬性值。如表1所示,展示了一些關于好萊塢女演員的三元組實體。
表1
如果將三元組實體作為點和邊,可以將主體作為出頂點、客體作為入頂點、謂詞作為邊。自然地,三元組實體就可以被表示成一張有向線段。大量的三元組實體之間是共享主體或客體的,如果將共享主體或客體的三元組實體連接在一起,就可以構(gòu)成一張數(shù)據(jù)網(wǎng)。如圖1所示,結(jié)合著表1中的好萊塢女演員的三元組實體示例,給出了與表1相對應的數(shù)據(jù)網(wǎng)。
Q/A系統(tǒng)中存在一個映射詞典,在該詞典中,可以將用戶輸入的問題切分成多個短語,分別將各短語映射成對應的三元組實體,則用戶輸入的問題可以映射成多個三元組實體,最終多個三元組實體可以構(gòu)成一張BGP(Basic Graph Pattern,基本圖模式)圖。如圖2所示,是針對問題“Which actress was born in countries in Europe?”生成的BGP圖。在圖2中,帶有“?”的主體或客體如“?actress”被設置為了變量。在RDF數(shù)據(jù)集中找到“Whichactress was born in countries in Europe?”對應的信息的過程,實際上就是將圖2在圖1中進行子圖匹配的過程。
以上介紹了Q/A系統(tǒng)如何在“知識庫”中尋找用戶輸入的問題所對應的信息。然而,在相關技術中,Q/A系統(tǒng)和“知識庫”自身存在許多不完善的問題如:短語鏈接錯誤、關系轉(zhuǎn)化錯誤以及結(jié)構(gòu)不當錯誤。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學,未經(jīng)北京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710620427.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種顆粒分級裝置
- 下一篇:一種裝有空氣干燥器的氣流分級機





