[發明專利]基于知識圖譜的問答系統中的處理方法和裝置有效
| 申請號: | 202010182500.7 | 申請日: | 2020-03-16 |
| 公開(公告)號: | CN111414465B | 公開(公告)日: | 2023-09-01 |
| 發明(設計)人: | 張文劍;牟小峰 | 申請(專利權)人: | 北京明略軟件系統有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/36;G06F40/242;G06F40/295 |
| 代理公司: | 北京安信方達知識產權代理有限公司 11262 | 代理人: | 張建秀;龍洪 |
| 地址: | 100084 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 知識 圖譜 問答 系統 中的 處理 方法 裝置 | ||
1.一種基于知識圖譜的問答系統中的處理方法,其特征在于,包括:
在接收到問句后,獲取所述問句在預先設置的知識庫中對應的主實體;
從所述主實體中選擇至少兩個候選主實體;
以每個候選主實體為根節點,在預先存儲的知識圖譜中搜索所述根節點的相鄰邊以及相鄰節點,并通過相鄰節點搜索所述相鄰節點在下一層的相鄰邊和相鄰節點,以此類推,直到搜索到最后一層的節點,得到每個候選主實體對應的路徑;
計算每個候選主實體的路徑所對應的文本信息與所述問句的文本信息的相似度;
選擇所述相似度符合預先設置的最高相似度判斷條件的路徑作為候選主實體的候選路徑;
從所述候選主實體的候選路徑中得到所述主實體的最終選擇路徑;
確定所述最終選擇路徑對應的文本信息,作為所述問句的答案;
其中,所述從所述候選主實體的候選路徑中得到所述主實體的最終選擇路徑,包括:
判斷所述候選路徑的相似度之間的差值是否大于或等于預設的閾值;
如果所述差值大于或等于所述閾值,則選擇所述候選路徑中相似度最高的路徑為最終選擇路徑;
如果所述差值小于所述閾值,則獲取所述候選路徑對應的文本信息與所述問句的重疊字數,選擇重疊字數最多的路徑為最終選擇路徑。
2.根據權利要求1所述的方法,其特征在于,所述獲取所述問句在預先設置的知識庫中對應的主實體,包括:
利用預先獲取的主實體詞典識別所述問句中的主實體提及,得到第一識別結果,其中所述主實體詞典包括所述知識庫中所有的主體和客體;以及,利用預先獲取的主題詞識別的深度學習模型,識別所述問句中的主實體提及,得到第二識別結果;
將所述第一識別結果和所述第二識別結果合并為最終的識別結果;
在預先設置的鏈接詞典中存儲的主實體提及與知識庫中主實體的對應關系,查找所述識別結果中的每個主實體提及對應的知識庫中的主實體。
3.根據權利要求1所述的方法,其特征在于,所述從所述主實體中選擇至少兩個候選主實體,包括:
確定每個主實體的至少兩個特征信息;
通過對同一個主實體的特征信息進行識別,得到每個主實體的得分信息;
根據每個主實體的得分信息,選擇至少兩個候選主實體。
4.根據權利要求1所述的方法,其特征在于:
在所述問句中包括n個主實體時,選擇所述n個主實體中一個主實體作為目標主實體,在確定目標主實體的候選主實體后,確定所述目標主實體的目標候選主實體;
其中所述目標候選主實體的候選路徑是通過如下方式得到的,包括:
在以每個目標候選主實體為根節點進行相鄰邊和相鄰節點的搜索過程中,在對所述相鄰節點在下一層的相鄰邊和相鄰節點的搜索時,利用所述n個主實體中的剩余的(n-1)個主實體進行路徑的篩選,得到所述目標候選主實體的候選路徑,其中n為大于等于2的整數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京明略軟件系統有限公司,未經北京明略軟件系統有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010182500.7/1.html,轉載請聲明來源鉆瓜專利網。





