[發明專利]自然語言理解系統及其工作方法在審
| 申請號: | 201710383133.5 | 申請日: | 2017-05-26 |
| 公開(公告)號: | CN108959239A | 公開(公告)日: | 2018-12-07 |
| 發明(設計)人: | 雷曉軍;周京 | 申請(專利權)人: | 上海醇聚信息科技有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 上海信好專利代理事務所(普通合伙) 31249 | 代理人: | 朱成之 |
| 地址: | 200000 上海市虹口區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 自然語言理解 句子 分析數據庫 關系詞 文本數據 語言理解 圖譜 認知 串行處理模式 文本輸入模塊 語義 定位模塊 分析模塊 句法語義 句子理解 切割模塊 信息丟失 圖譜庫 句法 推理 并行 切割 存儲 分析 | ||
本發明涉及一種自然語言理解系統及其工作方法,包含:S1、由文本輸入模塊輸入需要進行語言理解的文本數據;S2、根據分析數據庫,由句子切割模塊將輸入的文本數據切割為若干個句子;S3、根據分析數據庫,由關系詞定位模塊對每個句子進行關系詞的定位和確定;S4、根據分析數據庫,由句子理解分析模塊對每個句子的基本表述成分、關系詞之間的聯系、以及句法語義結構進行理解分析,得到知識圖譜;S5、將分析得到的知識圖譜存儲至知識圖譜庫中。本發明采用句法、語義和常識推理并行工作的認知模式,解決了由傳統串行處理模式帶來的信息丟失問題;并且采用人在自然語言理解中的認知特點,極大的提高語言理解的準確性和速度。
技術領域
本發明涉及一種自然語言理解系統及其工作方法,具體是指一種在句法、語義和常識推理并行處理的認知工作模式下的自然語言理解系統及其工作方法。
背景技術
計算機對自然語言的理解一直是困擾著人們的一個問題。計算機的自然語言理解是指讓計算機如人一樣理解日常交流的語言以及在書本上的語言。一旦實現,意義是巨大的,因為一旦計算機可以獨立的閱讀和理解人類的文字和話語,計算機就可以利用其存儲和計算能力,擁有海量知識,并在更大的范圍上更好的利用這些知識,形成人力不及的能力。
計算機的自然語言理解系統是人工智能研究中的一個分支,自上個世紀五十年代以來,人工智能學界和業界一直在不斷的投入人力和物力進行研究和開發,期待突破。雖然計算機的自然語言理解取得了巨大的進展,也在應用領域發揮了作用,但是離真正的可帶給人類幫助還遠遠的不足。計算機的自然語言理解系統的研發模式一直采用的是先句法后語義的串行處理系統,這不僅給語言理解帶來許多問題,更給漢語理解帶來了更為嚴重的問題。
傳統的計算機自然語言理解模式采取串行處理方式:即對一個句子先進行句法分析,得到句子的句法結構;然后對句法結構中的每個成分進行語義標注,得到句子的語義結構。這樣的串行處理方式割裂了本來是一體的理解過程,造成了許多處理過程中信息的丟失,使得自然語言理解過程遠離人類的語言理解過程,并且在漢語理解中尤其突出,這是不能研發出一個成熟的自然語言理解系統的重要原因。
基于上述,目前需要提出一種采用句法、語義和常識推理并行處理的認知工作模式來對自然語言進行理解處理,解決由傳統串行模式帶來的信息丟失問題,并且采用人在自然語言理解中的認知特點,提高語言理解的準確性和速度。
發明內容
本發明的目的是提供一種自然語言理解系統及其工作方法,采用句法、語義和常識推理并行工作的認知模式,解決了由傳統串行處理模式帶來的信息丟失問題;并且采用人在自然語言理解中的認知特點,極大的提高語言理解的準確性和速度。
為實現上述目的,本發明提供一種自然語言理解系統,包含:分析數據庫;文本輸入模塊,輸入需要進行語言理解的文本數據;句子切割模塊,分別與文本輸入模塊和分析數據庫連接,根據分析數據庫,將輸入的文本數據切割為若干個句子;關系詞定位模塊,分別與句子切割模塊以及分析數據庫連接,根據分析數據庫,對每個句子進行關系詞的定位和確定;句子理解分析模塊,分別與關系詞定位模塊以及分析數據庫連接,根據分析數據庫,對每個句子的基本表述成分、關系詞之間的聯系、以及句法語義結構進行理解分析,得到知識圖譜;知識圖譜庫,與句子理解分析模塊連接,用于存儲分析得到的知識圖譜。
所述的分析數據庫包含:句法語義詞典,由所有詞匯中每個詞所具有的句法語義信息構成;專有本體庫,指專有領域中供計算機使用的詞典;概念網絡庫,由所有概念之間形成的關系構成;常識庫,由一般知識累積構成;句法規則庫,由遣詞造句需要遵循的規則構成;語義規則庫,由判斷句子的每個基本表述是否符合意義、以及該些基本表述構成的整體表述是否符合意義的規則構成;推理規則庫,由從常識中正確推理獲得隱性知識的規則構成。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海醇聚信息科技有限公司,未經上海醇聚信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710383133.5/2.html,轉載請聲明來源鉆瓜專利網。





