[發明專利]分布式NLU/NLP在審
| 申請號: | 201380069684.4 | 申請日: | 2013-11-07 |
| 公開(公告)號: | CN104919522A | 公開(公告)日: | 2015-09-16 |
| 發明(設計)人: | 馬蒂厄·赫伯特;讓-菲利浦·羅比肖;克里斯多佛·M·帕里西安 | 申請(專利權)人: | 紐昂斯通訊公司 |
| 主分類號: | G10L15/30 | 分類號: | G10L15/30 |
| 代理公司: | 北京安信方達知識產權代理有限公司 11262 | 代理人: | 張瑞;鄭霞 |
| 地址: | 美國馬*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分布式 nlu nlp | ||
本申請要求2012年11月12日提交的美國專利申請13/674,191的優先權,該美國專利申請通過引用全部并入本文。
技術領域
本發明涉及一種用于自然語言處理的分布式客戶端-服務器系統。
背景技術
自然語言處理(NLP)和自然語言理解(NLU)涉及使用計算機處理,以從諸如人類產生的語音和文本等自然語言輸入提取有意義的信息。此類技術的一個最新應用是在諸如智能手機等移動設備中處理語音和/或文本查詢。
圖1示出處理語音查詢輸入并從各種頂級網站和內容源獲得同步搜索結果的一個此類移動設備應用龍搜索!(Dragon?Go!)的一些示例屏幕截圖。此類應用要求將自然語言理解組件添加到現有網站搜索算法,以便從輸入查詢提取語義含義。這可能涉及使用近似串匹配,以發現語義模板結構。一個或多個語義含義可以被分配給每個語義模板。解析規則和分類器訓練實例可以被生成并用來訓練確定查詢解釋(有時稱為查詢意圖)的NLU模型。
諸如龍搜索!等用于移動設備的復雜NLU應用使用客戶端-服務器架構實施,其中NLU處理僅在遠程服務器進行。但是,大量的相關數據可能被存儲在本地移動設備上,所述大量的相關數據需要上載到遠程NLU處理器,以優化NLU結果;例如,會議(標題、內容、參加者)列表、聯系人列表、歌曲列表等相關數據。由于包括保密考慮和純粹的需要上載并保持同步的數據量的各種原因,可以由服務器側NLU加以利用的數據的數據傳送會遇到問題。
發明內容
本發明的實施例涉及用于分布式自然語言處理的系統和對應的方法。一組本地數據源存儲在移動設備上。移動設備上的本地自然語言理解(NLU)匹配模塊執行結合所述本地數據源的自然語言輸入的自然語言處理,以確定一個或多個本地解釋候選。移動設備上的本地NLU排名模塊處理本地解釋候選和來自遠程NLU服務器的一個或多個遠程解釋候選,以確定對應于自然語言輸入的最終輸出解釋。
NLU排名模塊可以使用模糊匹配算法,以確定最終輸出解釋且/或在N最佳列表中對解釋候選進行排名。NLU排名模塊還可以在確定最終輸出解釋之前處理被識別為與本地數據源中表示的信息相關的遠程解釋候選。例如,NLU排名模塊還可以使用來自遠程NLU服務器的附加補充遠程解釋數據和來自本地數據源的數據,以確定最終輸出解釋。
移動設備可以向遠程NLU服務器轉發NLU匹配模塊的自然語言處理結果用于擴展遠程解釋候選。并且本地NLU排名模塊還可以考慮來自遠程NLU服務器的排名數據,以確定最終輸出解釋。
附圖說明
圖1示出用于移動設備的自然語言查詢應用的一些示例屏幕截圖。
圖2示出根據本發明的實施例所述的分布式自然語言處理系統的示例。
圖3是示出根據本發明的實施例所述的分布式自然語言處理中的各個功能步驟的流程圖。
具體實施方式
本發明實施例涉及NLU處理的分布式客戶端-服務器系統,所述NLU處理利用設備上的數據,在移動設備上進行一些本地處理,且使用服務器可用的數據和資源在服務器上進行一些遠程處理。
圖2示出分布式自然語言處理系統的示例,而且圖3是示出根據本發明的實施例所述的分布式自然語言處理中的各個功能步驟的流程圖。并且“呼叫鮑勃(call?bob)”的示例查詢可以用于進一步地解釋,并且為了進行所述討論,假設現在電影院上映的最新的電影的名稱為“呼叫鮑勃”。
移動設備200從用戶接收自然語言輸入201(步驟301)。移動設備200向遠程NLU服務器204轉發自然語言輸入201(步驟302),所述遠程NLU服務器204使用可用的遠程數據資源205執行輸入的NLU處理,以確定一個或多個遠程解釋候選。例如,移動設備200上的相對精簡的自然語言理解(NLU)匹配模塊202還使用模糊匹配算法執行結合本地數據源203的所述輸入的本地NLU處理,以確定一個或多個本地解釋候選(步驟303)。本地數據源203通常可包括但不限于設備的所有本地音樂列表、郵件內容、會議內容、聯系人列表等。在一些實施例中,由NLU匹配模塊202進行的本地NLU處理的部分或全部結果(例如,提及檢測結果、語義附接提取、查詢意圖和/或語義分類結果)也可以向遠程NLU服務器204轉發,所述遠程NLU服務器204可以使用該信息增加其自己的解釋。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于紐昂斯通訊公司,未經紐昂斯通訊公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201380069684.4/2.html,轉載請聲明來源鉆瓜專利網。





