[發明專利]語句解析方法及語句解析裝置在審
| 申請號: | 201710276537.4 | 申請日: | 2017-04-25 |
| 公開(公告)號: | CN107247613A | 公開(公告)日: | 2017-10-13 |
| 發明(設計)人: | 邢錦江;李劍;朱華;鄒雪梅;陳險峰;朱峰登;史可華;董揚威;李亮 | 申請(專利權)人: | 北京航天飛行控制中心 |
| 主分類號: | G06F9/45 | 分類號: | G06F9/45 |
| 代理公司: | 北京康信知識產權代理有限責任公司11240 | 代理人: | 吳貴明,張永明 |
| 地址: | 100094 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語句 解析 方法 裝置 | ||
技術領域
本發明涉及領域特定語言領域,具體而言,涉及一種語句解析方法及語句解析裝置。
背景技術
領域特定語言(Domain-Specific Language,簡稱為DSL)是針對特定應用領域而設計的計算機語言,它使用約定的文法,表達專業人員的意圖,輔助其在該領域中高效地解決問題。
在相關技術中,描述一種計算機語言,一般使用擴展巴科斯范式(Extended Backus-Naur Forms,簡稱為EBNF)。傳統的領域特定語言描述工具,如(Another Tool of Language Recognition,簡稱為Antlr),能夠在一定程度上簡化領域特定語言的設計。然而,傳統的基于擴展巴科斯范式的計算機語言描述方法,以及現有的語言描述和解析工具(如Antlr)還是存在問題的:例如,在一般的領域特定語言描述方法中,要求以英文作為基本詞法要素和關鍵字。但是,由于難以正確處理復雜的中文斷句邏輯,即使允許使用中文作為關鍵字,也必須像英文一樣,在詞與詞之間增加空格,因此,這種方法并不符合中文的語言習慣。
因此,在相關技術中,基于英文的領域特定語言,處理復雜,不符合中文的語言習慣。
發明內容
本發明實施例提供了一種語句解析方法及語句解析裝置,以至少解決在相關技術中,基于英文的領域特定語言,處理復雜,不符合中文的語言習慣的技術問題。
根據本發明實施例的一個方面,提供了一種語句解析方法,包括:獲取待解析語句;根據中文領域特定語言的語法,對待解析語句進行解析,其中,待解析語句和中文領域特定語言均是基于中文進行描述的。
可選地,語法采用動態可變數據進行描述;語法包括:用于描述中文領域特定語言的詞素的類型的符號,以及,除符號之外的用于對符號進行補充的字典。
可選地,根據中文領域特定語言的語法,對待解析語句進行解析包括:將待解析語句分解為基本詞素;對分解的基本詞素標注詞性;根據中文領域特定語言的語法,將標注了詞性的基本詞素解析為語法樹。
可選地,在將待解析語句分解為基本詞素之前,還包括:采用預定歧義判斷算法判斷待解析語句是否存在歧義;在判斷結果為是的情況下,采用預定規避措施對待解析語句存在的歧義進行規避。
可選地,將待解析語句分解為基本詞素包括:采用最長匹配原則,將待解析語句分解為基本詞素,其中,最長匹配原則為匹配盡可能長的語句。
可選地,根據中文領域特定語言的語法,將標注了詞性的基本詞素解析為語法樹包括以下之一:采用下降式語法樹解析算法,將標注了詞性的基本詞素解析為語法樹,其中,下降式語法樹解析算法為:在預定的詞素位置,依次向前搜索匹配,當匹配的詞素引用了除詞素所引用的符號之外的其他符號時,匹配其他符號;采用上升式語法樹解析算法,將標注了詞性的基本詞素解析為語法樹,其中,上升式語法樹解析算法為:構建從待解析語句分解產生的基本詞素的父節點,之后采用相同的方式構建父節點的父節點,直至產生唯一的根節點;采用下降式語法樹解析算法和上升式語法樹解析算法結合的方式,將標注了詞性的基本詞素解析為語法樹。
可選地,在將待解析語句分解為基本詞素之前,還包括:采用預定的省略語推斷算法,對待解析語句進行推斷,將待解析語句還原為完全信息的語句,其中,預定的省略語推斷算法包括以下至少之一:根據前文的基本詞素,對省略語進行補充的上文推斷算法;根據指代時間的基本詞素對時間進行推算的時間推斷算法;對未指定完整信息的基本詞素進行定位的業務對象推斷算法。
可選地,在根據中文領域特定語言的語法,將標注了詞性的基本詞素解析為語法樹之后,還包括:語法樹上的葉子節點將葉子節點的內容傳遞給葉子節點的父節點;父節點對所包括的所有葉子節點傳遞的內容進行處理,得到父節點的內容;依次執行:上述內容傳遞以及處理操作,直至根節點,以根節點的內容作為語法樹的最終值,其中,所述最終值用于執行應用程序接口。
根據本發明實施例的另一個方面,還提供了一種語句解析裝置,其特征在于,包括:獲取模塊,用于獲取待解析語句;解析模塊,用于根據中文領域特定語言的語法,對待解析語句進行解析,其中,待解析語句和中文領域特定語言均是基于中文進行描述的。
可選地,解析模塊包括:分詞單元,用于將待解析語句分解為基本詞素;標注單元,用于對分解的基本詞素標注詞性;解析單元,用于根據中文領域特定語言的語法,將標注了詞性的基本詞素解析為語法樹。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航天飛行控制中心,未經北京航天飛行控制中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710276537.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:作業描述方法及裝置
- 下一篇:在軟件編譯時檢查應用信息的方法





