[發明專利]一種基于SVM的非實體詞依賴關系提取的問句解析方法在審
| 申請號: | 201910957230.X | 申請日: | 2019-10-10 |
| 公開(公告)號: | CN110852067A | 公開(公告)日: | 2020-02-28 |
| 發明(設計)人: | 梁杰;凌立剛;王同和;王歡 | 申請(專利權)人: | 杭州量之智能科技有限公司 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F40/295;G06F40/30 |
| 代理公司: | 北京聯瑞聯豐知識產權代理事務所(普通合伙) 11411 | 代理人: | 夏允峰 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 svm 實體詞 依賴 關系 提取 問句 解析 方法 | ||
本發明提供了一種基于SVM的非實體詞依賴關系提取的問句解析方法,包括以下步驟:S1、獲取問句,生成實體詞關系確定的分析樹;S2、調整非實體詞節點在分析樹中的懸掛位置,得到符合語法規范的問句;S3、將所述問句通過SVM進行排序,輸出排序最高的問句對應的答案。本基于SVM的非實體詞依賴關系提取的問句解析方法,能夠提高準確性,對于訓練數據規模的要求更小,移植更方便。
技術領域
本發明涉及非實體詞依賴關系處理技術領域,尤其涉及一種基于SVM的非實體詞依賴關系提取的問句解析方法。
背景技術
在數據庫自然語言接口(Natural Language Interface to Databases,下簡稱為NLIDB)系統的構建過程中,正確解析問句語義是其中重要的一環。而在解析問句時,實體詞(實體的概念繼承自Ontology中的Domain ontology)之間的關系可通過數據庫元數據查找,非實體詞的依賴關系通常只能從語義角度出發來尋找,準確率相對不高。
現有系統在尋找問句中非實體詞的依賴關系這一問題上,主要采用以下幾種方式:
第一種是基于現有的semantic parser,接著對結果進行語法層面的調整。代表系統是NaLIR(Liand Jagadish,2014)。NaLIR首先基于Stanford Parser尋找問句中所有詞之間的依賴關系,構建分析樹,但由于Stanford Parser的準確率不高,NaLIR會對得到的分析樹進行大量的隨機調整,按照事先制定的基于語法匹配的評分規則進行排序。如圖1中,(a)是Stanford Parser的解析結果,而(c)是隨機調整后,根據制定的規則所選取出的最佳結果。
第二種是訓練一個專門的Semantic Parser。這是目前的主流思路(Dong andLapata,2016;Cai et al.,2017)。這類系統并不想通過規則去提取修飾關系,而是使用大量特定場景下的語料作為訓練數據,通過機器學習的方法訓練出更精準的、特定場景下的Semantic Parser。
對于第一種,基于現有parser加上基于規則的調整的系統,它們的問題在于:通用的parser(如Stanford Parser),特別是在處理復雜的中文句子的依賴關系時,精確性比較一般。通過調整得到的解析結果僅僅是符合語法規則的結果,而不一定在語義上正確;完全的隨機調整帶來了十分大的時間復雜度。
對于第二種,自行訓練parser的系統,它們的問題在于:需要大量訓練語料;可移植性很差;準確率較低。
發明內容
有鑒于此,本發明要解決的技術問題是提供一種基于SVM的非實體詞依賴關系提取的問句解析方法,能夠提高準確性,對于訓練數據規模的要求更小,移植更方便。
本發明的技術方案是這樣實現的:
一種基于SVM的非實體詞依賴關系提取的問句解析方法,包括以下步驟:
S1、獲取問句,生成實體詞關系確定的分析樹;
S2、調整非實體詞節點在分析樹中的懸掛位置,得到符合語法規范的問句;
S3、將所述問句通過SVM進行排序,輸出排序最高的問句對應的答案。
優選的,所述分析樹的節點的種類由以下一種或多種組成:
TreeNode種類、Relation種類、Aggregation種類、TopN種類、Operator種類、Aggregation種類、Logic種類、Domain種類、Entity種類、Count種類和GroupBy種類。
優選的,所述節點的種類中,非實體詞節點種類包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州量之智能科技有限公司,未經杭州量之智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910957230.X/2.html,轉載請聲明來源鉆瓜專利網。





