[發明專利]一種自然語言處理系統在審
| 申請號: | 201811069719.5 | 申請日: | 2018-09-13 |
| 公開(公告)號: | CN109213846A | 公開(公告)日: | 2019-01-15 |
| 發明(設計)人: | 張巍;胡慧香;郭繼紅;張曉瑛;徐雅琴;邊婧 | 申請(專利權)人: | 山西衛生健康職業學院 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33 |
| 代理公司: | 西安研創天下知識產權代理事務所(普通合伙) 61239 | 代理人: | 孫李林 |
| 地址: | 030012 *** | 國省代碼: | 山西;14 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 自然語言處理系統 邏輯推理 分詞處理模塊 自然語言信息 后處理模塊 語法數據庫 預處理模塊 知識數據庫 擴展性 參數標注 匹配模塊 輸出模塊 輸入模塊 文法規則 語法結構 語境處理 語言信息 規則集 模型庫 句子 抽象 | ||
本發明公開了一種自然語言處理系統,包括輸入模塊、語境處理模塊、預處理模塊、分詞處理模塊、后處理模塊、參數標注模塊、語法數據庫、文法規則匹配模塊、知識數據庫、邏輯推理模型庫和輸出模塊。本發明的自然語言處理系統通過聯系上下文、擴充參數詞典和規則集來提高對自然語言信息的理解能力,使系統有較好的領域擴展性。對于識別效果不好的語言信息只需按照其語法結構抽象出新的規則并添加到系統中,就能夠改善對這類句子的識別效果,實現起來簡單而有效。
技術領域
本發明屬于計算機技術領域,具體地說,涉及一種自然語言處理系統。
背景技術
自然語言處理是計算機科學領域與人工智能領域中的一個重要方向。它研究能實現人與計算機之間用自然語言進行有效通信的各種理論和方法。自然語言處理是一門融語言學、計算機科學、數學于一體的科學。因此,這一領域的研究將涉及自然語言,即人們日常使用的語言,所以它與語言學的研究有著密切的聯系,但又有重要的區別。自然語言處理并不是一般地研究自然語言,而在于研制能有效地實現自然語言通信的計算機系統,特別是其中的軟件系統。因而它是計算機科學的一部分。
自然語言的形式(字符串)與其意義之間是一種多對多的關系。其實這也正是自然語言的魅力所在。但從計算機處理的角度看,我們必須消除歧義,而且有人認為它正是自然語言理解中的中心問題,即要把帶有潛在歧義的自然語言輸入轉換成某種無歧義的計算機內部表示。
歧義現象的廣泛存在使得消除它們需要大量的知識和推理,這就給基于語言學的方法、基于知識的方法帶來了巨大的困難,因而以這些方法為主流的自然語言處理研究幾十年來一方面在理論和方法方面取得了很多成就,但在能處理大規模真實文本的系統研制方面,成績并不顯著。研制的一些系統大多數是小規模的、研究性的演示系統。
目前存在的問題有兩個方面:一方面,迄今為止的語法都限于分析一個孤立的句子,上下文關系和談話環境對本句的約束和影響還缺乏系統的研究,因此分析歧義、詞語省略、代詞所指、同一句話在不同場合或由不同的人說出來所具有的不同含義等問題,尚無明確規律可循,需要加強語用學的研究才能逐步解決。另一方面,人理解一個句子不是單憑語法,還運用了大量的有關知識,包括生活知識和專門知識,這些知識無法全部貯存在計算機里。因此一個書面理解系統只能建立在有限的詞匯、句型和特定的主題范圍內。
發明內容
本發明的目的在于提供一種提高處理質量的自然語言處理系統。
其技術方案如下:
一種自然語言處理系統,包括輸入模塊、語境處理模塊、預處理模塊、分詞處理模塊、后處理模塊、參數標注模塊、語法數據庫、文法規則匹配模塊、知識數據庫、邏輯推理模型庫和輸出模塊;
所述輸入模塊用于通過輸入設備輸入自然語言;
所述語境處理模塊用于通過聯系上下文,分析自然語言所處的語境;
所述預處理模塊用于對自然語言的源文本進行標記、拆分以及干擾符號的刪除,提高分詞速度和準確率;
所述分詞處理模塊用于將自然語言的句子劃分為詞序列;
所述后處理模塊用于對分詞處理模塊的分詞結果進行優化;
所述參數標注模塊用于對后處理模塊的分詞結果進行參數標注;
所述文法規則匹配模塊根據語法數據庫、知識數據庫、邏輯推理模型庫和參數標注模塊標注后的分詞結果進行匹配;
所述輸出模塊用于通過輸出設備輸出自然語言的處理結果的文字、圖形和語音。
進一步,所述輸入設備包括鍵盤、語音設備、圖文掃描設備。
進一步,所述干擾符號包括無用的空格、回車和與輸入介質相關的符號。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山西衛生健康職業學院,未經山西衛生健康職業學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811069719.5/2.html,轉載請聲明來源鉆瓜專利網。





