[發明專利]用于意圖推理的上下文無關文法的機器生成在審
| 申請號: | 201880089707.0 | 申請日: | 2018-11-23 |
| 公開(公告)號: | CN112074898A | 公開(公告)日: | 2020-12-11 |
| 發明(設計)人: | 李寶潔;顧海松 | 申請(專利權)人: | 美的集團股份有限公司 |
| 主分類號: | G10L15/18 | 分類號: | G10L15/18;G10L15/22;G10L15/26;G06F40/20;G06F40/30 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 劉欣;張穎玲 |
| 地址: | 528311 廣東省佛山市順德區*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 意圖 推理 上下文 無關 文法 機器 生成 | ||
一種用于生成用于意圖推理的上下文無關文法的方法,包括:針對與待由機器執行的第一任務對應的可操作意圖,通過編譯器檢索第一模板文件;使用編譯器解析第一模板文件,以識別第一非終結符變量,第一非終結符變量引用包含多個第一命名實體值的第一非終結符文件;以及基于在第一模板文件中指定的、包括至少第一產生式規則的多個產生式規則,生成與第一任務對應的可操作意圖的第一上下文無關文法,第一產生式規則包括第一非終結符變量,其中,生成與第一任務對應的可操作意圖的第一上下文無關文法包括:通過用多個第一命名實體值替換第一產生式規則中的第一非終結符變量來重寫第一產生式規則。
相關申請的交叉引用
本申請要求于2018年2月22日提交的申請號為15/902,911的美國專利申請的優先權,該專利申請的全部內容通過引用合并于此。
技術領域
本公開總體上涉及用于意圖推理的上下文無關文法(context free grammar,CFG)的機器生成,并且更具體地,涉及用于在家居控制設置中生成用于意圖推理的上下文無關文法的方法和系統。
背景技術
最近,基于語音的數字助理(例如,蘋果的SIRI、亞馬遜的Echo、谷歌的谷歌助理和微軟的Cortana)已被引入市場,以處理各種任務(例如,家用電器控制、網絡搜索、日歷、提醒等)。為了啟動基于語音的助理,用戶可以按下按鈕或在觸摸屏上選擇圖標,或者說出觸發詞(例如,預定義的喚醒命令),然后說出描述他/她的意圖的自然語言命令。
現有技術的自然語言處理技術依賴于自然語言處理模型,由于高計算量和人員成本,這些自然語言處理模型難以實現和更新。另外,使自然語言處理模型變得過時和不準確的另一個原因是缺乏足夠的訓練樣本。因此,在家用電器控制和其他類似應用的背景下,提供一種對自然語言處理模型的實現和更新進行改進的方式將是有益的。
發明內容
在家用電器控制設置中,可以通過對用戶話語的自然語言處理來確定用戶的意圖。但是,不同的設備有許多功能和特定設置。為這些不同的功能和設置創建自然語言處理模型,包括生成用于區分與不同功能和設置相關的意圖的上下文無關文法,既繁瑣又耗時。此外,隨著功能和設置變得越來越復雜和多樣化,針對不同的意圖手動寫出上下文無關文法變得越來越站不住腳并且容易出錯。有時,當市場上引入新詞、新模型和新功能時,自然語言處理模型可能已經過時,并且更新自然語言處理模型以快速適應現實世界的變化需要大量的時間和資源。
此外,訓練自然語言處理模型(包括語音到文本模型)需要大量的語言樣本,但是鑒于自然語言處理模型需要包含許多設置和功能,因此收集如此大量的語言樣本是一項艱巨的任務。如果沒有足夠數量的語言樣本來訓練語言模型,那么語言模型將無法產生可操作意圖,或者意圖識別的準確性較低。此外,隨著新的功能和設置的推出以及新電器的上市,現有的自然語言處理模型可能沒有配備詞匯和工具來識別與這些新的功能和設置有關的意圖。從用戶那里收集新的語言樣本來擴展現有的語言處理模型以覆蓋這些新的功能和設置是困難的,因為在通過實際使用成功以向用戶保證自然語言處理模型可以處理這些新命令之前,用戶不太可能使用這些新命令。
在某些情況下,當一個家庭中有多個用戶,和/或同一家庭中有多個相同類型的電器時,現有技術的自然語言處理技術不能有效地消除由不同用戶發出并指向相同類型的不同電器的意圖和指令之間的歧義。盡管可以使用上下文信息(例如用戶的當前位置和用戶的先前行為)來幫助識別用戶的意圖,但是上下文信息的使用需要其他功能以及用戶隱私權的折中,并且在許多情況下可能不會產生準確的結果。有時,數字助理和用戶之間的互動式問答可以幫助消除用戶意圖的歧義,但是這種互動既費時又麻煩,并且計算量很大。
鑒于實現和更新自然語言處理模型的常規方式的許多問題,包括生成針對不同意圖的上下文無關文法以及基于語言樣本訓練自然語言處理模型,本公開描述了一種用于基于上下文無關文法模板和相應的非終結符文件來機器生成上下文無關文法的方法和系統,該方法和系統簡單、模塊化且可擴展。上下文無關文法的模塊化機器生成使調試過程更加簡單。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于美的集團股份有限公司,未經美的集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201880089707.0/2.html,轉載請聲明來源鉆瓜專利網。





