[發明專利]數據處理方法和數據處理裝置在審
| 申請號: | 201610917225.2 | 申請日: | 2016-10-20 |
| 公開(公告)號: | CN107967285A | 公開(公告)日: | 2018-04-27 |
| 發明(設計)人: | 繆慶亮;孟遙 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京集佳知識產權代理有限公司11227 | 代理人: | 康建峰,李春暉 |
| 地址: | 日本神*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據處理 方法 裝置 | ||
技術領域
本發明的實施例涉及數據處理領域,具體地涉及可以根據語義知識庫確定問題答案的數據處理方法和數據處理裝置。
背景技術
這個部分提供了與本發明有關的背景信息,這不一定是現有技術。
問答系統是信息檢索系統的一種高級形式。當用戶用自然語言提出問題時,問答系統可以通過在語義知識庫中進行檢索匹配來用自然語言回答用戶提出的問題。然而,隨著語義知識庫的快速增長,從海量的語義知識庫中快速準確地尋找到問題的答案也越來越困難。
RDF(Resource Description Framework,資源描述框架)是一個典型的資源庫。在傳統的處理方法中,問答系統首先對自然語言問句進行句法分析和語義角色標注,從而將自然語言問句翻譯為標準的查詢語句,例如SPARQL(Simple Protocol And RDF Query Language,簡單協議和RDF查詢語言),然后根據標準的查詢語句在整個資源庫中尋找問題語句的答案。
在傳統的處理方法中,需要對問句進行句法分析和語義角色標注,并且需要轉換標準查詢語句,增大了處理的難度,延長了處理的時間。進一步,在傳統的處理方法中,需要根據標準的查詢語句在整個資源庫中尋找問題語句的答案,隨著資源庫的逐漸增大,搜索問題答案的時間也將越來越長。
針對以上技術問題,本發明希望提出一種方案,能夠快速可靠地根據語義知識庫確定問題語句的答案。
發明內容
這個部分提供了本發明的一般概要,而不是其全部范圍或其全部特征的全面披露。
本發明的目的在于提供一種數據處理方法和數據處理裝置,能夠快速可靠地根據語義知識庫確定問題語句的答案。
根據本發明的一方面,提供了一種數據處理方法,包括:基于語義知識庫構建問題語句的語義圖;根據所述語義圖確定所述問題語句的答案類型;根據所述答案類型從所述語義圖中確定候選語義子圖;根據所述候選語義子圖確定一個或者多個候選三元組;根據所述問題語句確定問題三元組;以及基于所述一個或者多個候選三元組中的每個候選三元組與所述問題三元組的相似度來確定所述問題語句的答案。
根據本發明的另一方面,提供了一種數據處理裝置,包括:語義圖構建單元,用于基于語義知識庫構建問題語句的語義圖;答案類型確定單元,用于根據所述語義圖確定所述問題語句的答案類型;語義子圖確定單元,用于根據所述答案類型從所述語義圖中確定候選語義子圖;候選三元組確定單元,用于根據所述候選語義子圖確定一個或者多個候選三元組;問題三元組確定單元,用于根據所述問題語句確定問題三元組;以及答案確定單元,用于基于所述一個或者多個候選三元組中的每個候選三元組與所述問題三元組的相似度來確定所述問題語句的答案。
根據本發明的另一方面,提供了一種程序產品,該程序產品包括存儲在其中的機器可讀指令代碼,其中,所述指令代碼當由計算機讀取和執行時,能夠使所述計算機執行根據本發明的數據處理方法。
根據本發明的另一方面,提供了一種機器可讀存儲介質,其上攜帶有根據本發明的程序產品。
使用根據本發明的數據處理方法和數據處理裝置,將問題語句轉換為問題三元組,通過問題三元組和候選三元組的相似度來確定問題的答案,無需對問題語句進行句法分析和語義角色標注,也不需要轉換標準查詢語句。這樣一來,降低了處理的難度,提高了處理的效率,節約搜索時間。進一步,可以根據問題語句的答案類型從語義圖中確定候選語義子圖,并根據候選語義子圖確定候選三元組,從而確定問題語句的答案。這樣一來,將語義知識庫中的語義圖縮小到候選語義子圖,無需在整個語義知識庫中搜索問題的答案,大大減小了搜索的范圍,從而縮短檢索的時間并提高答案的準確性。綜上,根據本發明的數據處理方法和數據處理裝置能夠快速可靠地根據語義知識庫確定問題語句的答案。
這個概要中的描述和特定例子只是為了示意的目的,而不旨在限制本發明的范圍。
附圖說明
在此描述的附圖只是為了所選實施例的示意的目的而非全部可能的實施,并且不旨在限制本發明的范圍。在附圖中:
圖1示出了根據本發明的實施例的數據處理方法的流程圖;
圖2示出了根據本發明的實施例的數據處理方法中構建問題語句的語義圖的流程圖;
圖3示出了根據本發明的實施例的構建的語義圖的一個示例;
圖4示出了根據本發明的實施例的構建的語義圖的另一個示例;
圖5示出了根據本發明的實施例的構建的語義圖的又一個示例;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610917225.2/2.html,轉載請聲明來源鉆瓜專利網。





