[發(fā)明專利]使用自然語言處理基于用戶輸入執(zhí)行任務(wù)的系統(tǒng)和方法在審
| 申請?zhí)枺?/td> | 201810962297.8 | 申請日: | 2018-08-22 |
| 公開(公告)號: | CN109725961A | 公開(公告)日: | 2019-05-07 |
| 發(fā)明(設(shè)計(jì))人: | 姚旭晨 | 申請(專利權(quán))人: | 百度(美國)有限責(zé)任公司 |
| 主分類號: | G06F9/451 | 分類號: | G06F9/451;G06F3/01;G10L15/22 |
| 代理公司: | 北京英賽嘉華知識產(chǎn)權(quán)代理有限責(zé)任公司 11204 | 代理人: | 馬曉亞;王艷春 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 觸發(fā) 自然語言 自然語言處理 自然語言理解 任務(wù)自動化 觸發(fā)條件 動作領(lǐng)域 多個動作 分類能力 個人助理 命令解析 輸入執(zhí)行 提示用戶 系統(tǒng)配置 語音指示 自動完成 自動執(zhí)行 選項(xiàng) 分析 指令 | ||
本發(fā)明的實(shí)施方式提供了一種自動執(zhí)行經(jīng)由口述指令或語音指示的相對復(fù)雜的任務(wù)的自然語言理解(NLU)系統(tǒng)。通常地,任務(wù)自動化具有觸發(fā)條件和一系列的一個或多個動作,其需要用戶經(jīng)由手動輸入對選項(xiàng)進(jìn)行選擇。原因在于,底層的機(jī)器邏輯需要來自常規(guī)個人助理不具備的多個領(lǐng)域的知識和分類能力。本發(fā)明的系統(tǒng)和方法的實(shí)施方式通過以下步驟來提供對這種復(fù)雜任務(wù)的解決方案:分析觸發(fā)領(lǐng)域和動作領(lǐng)域;精確定位適當(dāng)?shù)腁PI;提取相應(yīng)API參數(shù);以及為用戶自動完成API調(diào)用。本系統(tǒng)配置成將自然語言命令解析成API調(diào)用。本系統(tǒng)對觸發(fā)API和動作API二者進(jìn)行分析,并在必要時提示用戶任何缺失的信息。
技術(shù)領(lǐng)域
本發(fā)明的實(shí)施方式大致涉及裝置的任務(wù)管理。更具體地,本發(fā)明的實(shí)施方式涉及基于人的意圖來執(zhí)行復(fù)雜任務(wù)。
背景技術(shù)
由于數(shù)字個人助理應(yīng)用程序的興起,使用語音命令查詢并控制外部裝置、過程或服務(wù)已成為現(xiàn)實(shí)。然而,這些應(yīng)用程序在功能、能力和自動化程度方面仍然非常受限。
在物聯(lián)網(wǎng)(IoT)的開放世界中,將所有裝置和服務(wù)連接在一起并且可通過用于基本操作(諸如,讀取和運(yùn)行)或更先進(jìn)的操作(諸如,為臨界時間任務(wù)推送通知)的已公開的應(yīng)用編程接口(API)來可編程地訪問大部分裝置和服務(wù)。下一代人機(jī)交互工作的目標(biāo)之一在于,經(jīng)由自然語音或文本而不需要用戶提供太多(如果需要的情況下)編程知識來使得這些API可訪問且互連。當(dāng)系統(tǒng)需要在單個復(fù)雜的句子中從多種領(lǐng)域識別多個意圖時,是具有挑戰(zhàn)的。使用底層API調(diào)用來實(shí)現(xiàn)這些復(fù)雜的自然語言指令也具有挑戰(zhàn)性。
然而,存在一些支持這些任務(wù)的服務(wù),所有這些服務(wù)都需要較長的過程使得用戶精確地指明用戶所預(yù)期的服務(wù)和相對重要且繁重的配置量。例如,常規(guī)服務(wù)需要用戶填寫若干步驟以生成所期望的自動規(guī)則的過程。通常這個過程需要幾分鐘到幾十分鐘。
另一方面,希望使這些任務(wù)自動化并使其可供一般用戶使用而不需要重要的和(在某些情況下)專業(yè)的編程知識,這是開發(fā)各種個人助理應(yīng)用程序和裝置(例如,谷歌Home,蘋果Siri,微軟Cortana,亞馬遜Echo)的動機(jī),所有這些應(yīng)用程序和裝置均提供文本接口或語音接口從而為用戶執(zhí)行簡單的任務(wù)。然而,這些個人助理應(yīng)用程序的能力仍然非常受限于其提供者所生成的非常簡單的命令和相對小的生態(tài)系統(tǒng)。
發(fā)明內(nèi)容
本公開的實(shí)施方式提供基于用戶輸入自動執(zhí)行任務(wù)的計(jì)算機(jī)實(shí)施方法,非暫時性機(jī)器可讀介質(zhì)以及數(shù)據(jù)處理系統(tǒng)。
在本公開的一方面,基于用戶輸入自動執(zhí)行任務(wù)的計(jì)算機(jī)實(shí)施方法包括:響應(yīng)于源自用戶的輸入文本,對所述輸入文本執(zhí)行自然語言處理操作,以確定待響應(yīng)于條件而被執(zhí)行的任務(wù);基于所述自然語言處理操作來確定與所述條件有關(guān)的第一領(lǐng)域以及與待被執(zhí)行的所述任務(wù)有關(guān)的第二領(lǐng)域;確定與所述第一領(lǐng)域有關(guān)的第一應(yīng)用編程接口和與所述第二領(lǐng)域有關(guān)的第二應(yīng)用編程接口;以及響應(yīng)于經(jīng)由所述第一應(yīng)用編程接口從第一應(yīng)用程序接收的通知,經(jīng)由所述第二應(yīng)用編程接口向第二應(yīng)用程序發(fā)送控制命令,所述控制命令請求所述第二應(yīng)用程序執(zhí)行所述任務(wù)。
在本公開的另一方面,非暫時性機(jī)器可讀介質(zhì)存儲有指令,所述指令在由處理器執(zhí)行時致使所述處理器執(zhí)行操作,所述操作包括:響應(yīng)于源自用戶的輸入文本,對所述輸入文本執(zhí)行自然語言處理操作,以確定待響應(yīng)于條件而被執(zhí)行的任務(wù);基于所述自然語言處理操作來確定與所述條件有關(guān)的第一領(lǐng)域以及與待被執(zhí)行的所述任務(wù)有關(guān)的第二領(lǐng)域;確定與所述第一領(lǐng)域有關(guān)的第一應(yīng)用編程接口和與所述第二領(lǐng)域有關(guān)的第二應(yīng)用編程接口;以及響應(yīng)于經(jīng)由所述第一應(yīng)用編程接口從第一應(yīng)用程序接收的通知,經(jīng)由所述第二應(yīng)用編程接口向第二應(yīng)用程序發(fā)送控制命令,所述控制命令請求所述第二應(yīng)用程序執(zhí)行所述任務(wù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度(美國)有限責(zé)任公司,未經(jīng)百度(美國)有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810962297.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 計(jì)算機(jī)化的自然語言查詢意圖分派
- 自然語言處理方法及相關(guān)設(shè)備、系統(tǒng)和存儲裝置
- 一種支持多種服務(wù)的自然語言處理方法、裝置及系統(tǒng)
- 一種自然語言處理方法、裝置、設(shè)備及可讀存儲介質(zhì)
- 自然語言處理模型的訓(xùn)練方法、裝置、設(shè)備及存儲介質(zhì)
- 一種基于語義識別的自然語言處理方法、裝置和系統(tǒng)
- 一種自然語言處理方法和裝置
- 自然語言轉(zhuǎn)換處理方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種基于NLP自然語言的自動提取方法及裝置
- 藏語自然語言訓(xùn)練方法及數(shù)據(jù)處理平臺





