[發(fā)明專利]將自然語言翻譯成計算機語言的方法、語義分析器及人機對話系統(tǒng)有效
| 申請?zhí)枺?/td> | 201310657042.8 | 申請日: | 2013-12-06 |
| 公開(公告)號: | CN103617159B | 公開(公告)日: | 2016-10-12 |
| 發(fā)明(設(shè)計)人: | 萬繼華 | 申請(專利權(quán))人: | 萬繼華 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28;G06F17/27 |
| 代理公司: | 廣州凱東知識產(chǎn)權(quán)代理有限公司 44259 | 代理人: | 姚迎新 |
| 地址: | 410008 湖南省長沙*** | 國省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 自然語言 譯成 計算機語言 方法 語義 分析器 人機對話 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及計算機領(lǐng)域,具體說是將一種將自然語言翻譯成計算機語言的方法、利用該方法制成的語義分析器及人機對話系統(tǒng)。
背景技術(shù)
人類日常生活中用于傳遞信息和進行交流的語言,是自然語言,包括口頭語言即語音,和書面語言即文字兩種基本形式。自然語言是人類在改造客觀世界的過程中產(chǎn)生的,并隨著人類社會和客觀世界的變化而不斷發(fā)展。人類自然語言中所涉及的每一概念總是與客觀世界中的某一具體事物或事件相對應(yīng),由于客觀世界中的任一具體事物或事件的存在形式總是一個特定的唯一對象,所以人類自然語言中的概念或詞語所及的任一特定事物或事件也必然是唯一的對象。
當(dāng)今社會已進入到了一個科技日新月異的時代。其中,一個最明顯的標志是高科技信息產(chǎn)品大量涌入消費市場。它們?yōu)槿藗兊墓ぷ鳎睿涣鳎瑢W(xué)習(xí)和通信帶來了很大的便利和享受。另一方面,高科技信息產(chǎn)品的普及也為高科技信息產(chǎn)品自身的提升帶來很大挑戰(zhàn)。其中一大挑戰(zhàn)是基于自然語言的人機對話。要實現(xiàn)基于自然語言的人機對話,有兩大問題需要解決。一是把語音信號轉(zhuǎn)換成文字符號;二是把文字符號轉(zhuǎn)換成計算機可識別的程序語言。目前,第一個問題已得到較好解決,它就是人們通常所說的語音識別技術(shù)。但是,當(dāng)今的語音識別技術(shù)沒有解決計算機對自然語言文字的理解這個問題。比如,現(xiàn)有的人機對話系統(tǒng)和信息搜索產(chǎn)品都使用查表算法。從根本上說,它們都沒有解決機器對自然語言文字的識別和理解。這一缺陷導(dǎo)致很多高科技產(chǎn)品,無法實現(xiàn)一些非常有用的功能。
目前,世界上沒有一臺電腦能懂得人們?nèi)粘S玫淖匀徽Z言,也就是說,人們還無法通過自然語言去告訴電腦要去做什么,或回答人們的提問。展望未來,在日本等國家的推動下,家用機器人將成為普及率很高的消費品之一。為了實現(xiàn)這個商業(yè)目標,目前急待要解決的一大技術(shù)難題是怎么將自然語言翻譯成計算機語言。
由于將自然語言翻譯成計算機語言是一個技術(shù)難題,目前市場上出現(xiàn)的人機對話裝置均不能實現(xiàn)深層智能化應(yīng)用需求的自然語言識別和理解功能,如根據(jù)人的自然語言作出響應(yīng)、通過語音信號所表達的語義直接完成具體操作等。
發(fā)明內(nèi)容
針對計算機無法對自然語言識別的技術(shù)問題,本發(fā)明的目的在于提供一種將自然語言翻譯成計算機語言的方法。
本發(fā)明解決上述技術(shù)問題采用的技術(shù)方案為:一種將自然語言翻譯成計算機語言的方法,其包括以下步驟:
(1)將自然語言輸入計算機;
(2)計算機利用詞庫和自然語言分詞規(guī)則識別提取自然語言文字中的語法成分、邏輯聯(lián)結(jié)詞和邏輯語義,并基于信息管理庫將語法成分翻譯成表示計算機面向?qū)ο笳Z言中的基本元素名稱的字符串代碼、將邏輯聯(lián)結(jié)詞翻譯成表示程序控制的程序轉(zhuǎn)移指令代碼、將邏輯語義翻譯成表示肯定和否定的二進制代碼;
(3)將所述字符串代碼、程序轉(zhuǎn)移指令代碼和二進制代碼拼接成計算機可識別的程序語言。
進一步地,步驟(2)中計算機識別和提取自然語言文字中的主語、謂語、定語、賓語、狀語和補語六種語法成分,并將其對應(yīng)為計算機面向?qū)ο笳Z言中的對象、函數(shù)、屬性和參數(shù)四種基本元素,其中主語翻譯為表示對象名稱的字符串代碼,謂語翻譯為表示函數(shù)名稱的字符串代碼,定語翻譯為表示屬性或參數(shù)名稱的字符串代碼,賓語、狀語和補語翻譯為表示參數(shù)名稱的字符串代碼。
進一步地,步驟(2)中所述邏輯聯(lián)結(jié)詞包括與、或、條件三種,分別對應(yīng)與、或、條件三種邏輯關(guān)系,并將其分別翻譯成順序轉(zhuǎn)移指令代碼、選擇轉(zhuǎn)移指令代碼和條件轉(zhuǎn)移指令代碼。
進一步地,步驟(2)中所述邏輯語義是指主語和謂語中表示肯定和否定的兩種語義,當(dāng)主語和謂語中出現(xiàn)如沒、不、非和無等否定詞時,為否定邏輯語義,否則為肯定邏輯語義,并將其編碼為二進制代碼,否定為0,肯定為1。
進一步地,所述詞庫存儲單詞、詞組及與單詞和詞組對應(yīng)的詞性。
上述技術(shù)方案根據(jù)語法規(guī)則對自然語言進行語法成分的劃分,按照計算機程序的映射、拼接方法對各語法成分進行技術(shù)處理,從而將任何自然語言翻譯成計算機可識別的程序語言,實現(xiàn)了計算機對自然語言的識別和理解,為開發(fā)深層智能化電子產(chǎn)品奠定了技術(shù)基礎(chǔ)。
本發(fā)明還提供一種語義分析器,該語義分析器按照上述方法制成,其可通過軟件或硬件形式表現(xiàn),以達到將自然語言翻譯為計算機語言可識別的程序語言的目的。
針對現(xiàn)有電子產(chǎn)品不能實現(xiàn)深層智能化的技術(shù)問題,本發(fā)明提供一種包含上述語義分析器的人機對話系統(tǒng),還包括:
語音轉(zhuǎn)換器,將自然語言的語音實時轉(zhuǎn)換成文字;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于萬繼華,未經(jīng)萬繼華許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310657042.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





