[發(fā)明專利]自然語言處理方法及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201611202712.7 | 申請(qǐng)日: | 2016-12-21 |
| 公開(公告)號(hào): | CN106844335A | 公開(公告)日: | 2017-06-13 |
| 發(fā)明(設(shè)計(jì))人: | 嚴(yán)潔;汪坤;任耀洲;常元章;霍光磊;易梅 | 申請(qǐng)(專利權(quán))人: | 海航生態(tài)科技集團(tuán)有限公司 |
| 主分類號(hào): | G06F17/27 | 分類號(hào): | G06F17/27;G06F17/30 |
| 代理公司: | 北京康信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司11240 | 代理人: | 韓建偉,張永明 |
| 地址: | 100013 北京*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 自然語言 處理 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及信息處理領(lǐng)域,具體而言,涉及一種自然語言處理方法及裝置。
背景技術(shù)
在科技發(fā)展的今天,信息迅速膨脹,自然語言理解技術(shù)已成為人們?nèi)粘I钜约翱萍籍a(chǎn)業(yè)關(guān)注的焦點(diǎn),它也是衡量機(jī)器智能化的一個(gè)重要指標(biāo)。近年來隨著機(jī)器學(xué)習(xí)技術(shù)的發(fā)展以及深度學(xué)習(xí)技術(shù)應(yīng)用的普及,自然語言技術(shù)也開始應(yīng)用于多個(gè)領(lǐng)域(如,搜索、問答、對(duì)話機(jī)器人等),提高機(jī)器對(duì)自然語言的理解能力,從而降低人機(jī)溝通的門檻。
但是,隨著自然語言理解技術(shù)的普及,不同的行業(yè)都會(huì)面臨一個(gè)共同的問題,深度學(xué)習(xí)需要特定領(lǐng)域龐大的語料作驅(qū)動(dòng)。對(duì)于不同的應(yīng)用領(lǐng)域來說,如何獲取有效的數(shù)據(jù),成為問題的核心。大部分任務(wù)在創(chuàng)建之初并沒有可供使用的特定語料,因此很難在特定的領(lǐng)域?qū)崿F(xiàn)不同人機(jī)的對(duì)話;同時(shí)對(duì)于自然語言的處理,也無法準(zhǔn)確確定自然語言處理結(jié)果,向終端等設(shè)備呈現(xiàn)的結(jié)果也不準(zhǔn)確,導(dǎo)致在人機(jī)溝通的過程中降低用戶的體驗(yàn)感。
在聊天機(jī)器人領(lǐng)域,可分為open域和close域(又叫任務(wù)驅(qū)動(dòng))的聊天機(jī)器人,其中,自然語言存在多變性和抽象性,在任務(wù)驅(qū)動(dòng)聊天機(jī)器人方面,其中一種是基于深度學(xué)習(xí)技術(shù),通過模擬整個(gè)對(duì)話過程,實(shí)現(xiàn)人機(jī)交互。但是此種方案需要大量的語料做驅(qū)動(dòng),對(duì)于項(xiàng)目初創(chuàng)階段,如果沒有好的資源依托很難得到滿意的結(jié)果。另外一種方案是偏向于應(yīng)用的對(duì)話服務(wù)機(jī)器人,該方案通過自身產(chǎn)品的優(yōu)勢(shì)(如百度、Google有龐大的后臺(tái)語料數(shù)據(jù)庫)或者常年在自然語言方面的積累(小型機(jī)器人對(duì)話),挖掘大量的實(shí)體構(gòu)建實(shí)體關(guān)系庫,但是實(shí)體關(guān)系庫中的資源一般都是不公開的,其他企業(yè)很難利用這方面的優(yōu)勢(shì)去構(gòu)建符合企業(yè)自身的產(chǎn)品,而且該類產(chǎn)品的應(yīng)用領(lǐng)域也是有限的。也無法通過自然語言的對(duì)話實(shí)現(xiàn)人機(jī)順暢的交互。
針對(duì)上述的無法準(zhǔn)確確定自然語言對(duì)應(yīng)的信息的問題,目前尚未提出有效的解決方案。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種自然語言處理方法及裝置,以至少解決無法準(zhǔn)確確定自然語言對(duì)應(yīng)的信息的技術(shù)問題。
根據(jù)本發(fā)明實(shí)施例的一個(gè)方面,提供了一種自然語言處理方法,包括:接收第一語句,其中,所述第一語句為自然語言表達(dá)的語句;提取所述第一語句的一個(gè)或多個(gè)關(guān)鍵詞;查找到所述一個(gè)或多個(gè)關(guān)鍵詞對(duì)應(yīng)的信息或命令;呈現(xiàn)所述信息或所述命令的執(zhí)行結(jié)果。
進(jìn)一步地,提取所述第一語句的一個(gè)或多個(gè)關(guān)鍵詞包括:對(duì)所述第一語句進(jìn)行分詞得到多個(gè)詞語;使用所述多個(gè)詞語與預(yù)先配置的多個(gè)模板進(jìn)行匹配,其中,所述模板是指由多個(gè)語義元組成的連貫語義模式,每個(gè)所述語義元有預(yù)先設(shè)定的與所述模板對(duì)應(yīng)的語義貢獻(xiàn)度,所述語義元是指具有相同或近似語義的關(guān)鍵詞集合;從所述多個(gè)模板中獲取第一模板,所述第一模板是指與所述多個(gè)詞語部分或全部語義關(guān)聯(lián)度最高的模板;獲取所述多個(gè)詞語中與所述第一模板中的語義元匹配成功的詞語,將所述匹配成功的詞語作為關(guān)鍵詞。
進(jìn)一步地,在查找到所述一個(gè)或多個(gè)關(guān)鍵詞對(duì)應(yīng)的信息或命令之后,所述方法還包括:在所述信息或所述命令的執(zhí)行結(jié)果不唯一的情況下,呈現(xiàn)提示信息,其中,所述提示信息用于指示輸入屬性參數(shù);接收第二語句,并從所述第二語句中獲取屬性參數(shù);呈現(xiàn)所述信息或所述命令的執(zhí)行結(jié)果包括:根據(jù)所述屬性參數(shù)呈現(xiàn)所述信息或所述命令的執(zhí)行結(jié)果。
進(jìn)一步地,所述一個(gè)或多個(gè)關(guān)鍵詞包括:用于查找信息或命令的第一關(guān)鍵詞、和用于標(biāo)識(shí)屬性參數(shù)的第二關(guān)鍵詞,查找到所述一個(gè)或多個(gè)第一關(guān)鍵詞對(duì)應(yīng)的信息或命令包括:根據(jù)所述第一關(guān)鍵詞查找與所述第一關(guān)鍵詞對(duì)應(yīng)的信息或命令,其中,所述第二關(guān)鍵詞作為所述信息或命令的屬性參數(shù)。
進(jìn)一步地,根據(jù)所述第一關(guān)鍵詞查找與所述第一關(guān)鍵詞對(duì)應(yīng)的信息或命令包括:使用所述第一關(guān)鍵詞,作為預(yù)先配置的至少一個(gè)決策的輸入;獲取所述至少一個(gè)決策中的最優(yōu)決策對(duì)應(yīng)的信息或命令。
根據(jù)本發(fā)明實(shí)施例的另一方面,還提供了一種自然語言處理裝置,包括:接收單元,用于接收第一語句,其中,所述第一語句為自然語言表達(dá)的語句;提取單元,用于提取所述第一語句的一個(gè)或多個(gè)關(guān)鍵詞;查找單元,用于查找到所述一個(gè)或多個(gè)關(guān)鍵詞對(duì)應(yīng)的信息或命令;第一呈現(xiàn)單元,用于呈現(xiàn)所述信息或所述命令的執(zhí)行結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于海航生態(tài)科技集團(tuán)有限公司,未經(jīng)海航生態(tài)科技集團(tuán)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611202712.7/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





