[發(fā)明專利]數(shù)控系統(tǒng)的遠程語音控制方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 201811511399.4 | 申請日: | 2018-12-11 |
| 公開(公告)號: | CN109686374A | 公開(公告)日: | 2019-04-26 |
| 發(fā)明(設(shè)計)人: | 楊斌堂;何杰;李澤星 | 申請(專利權(quán))人: | 上海交通大學(xué) |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/22;G10L15/34;G06F17/27;G05B19/18 |
| 代理公司: | 上海漢聲知識產(chǎn)權(quán)代理有限公司 31236 | 代理人: | 莊文莉 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)控系統(tǒng) 指令序列 數(shù)控系統(tǒng)控制器 遠程語音控制 對數(shù)控系統(tǒng) 云計算中心 文本信息 語音控制系統(tǒng) 語音信息獲取 控制指令 模型解析 人員操作 生成步驟 生成指令 意圖識別 應(yīng)用場景 語音控制 語音信息 指令執(zhí)行 容錯性 音信息 內(nèi)置 指令 終端 轉(zhuǎn)化 | ||
本發(fā)明提供了一種數(shù)控系統(tǒng)的遠程語音控制方法及系統(tǒng),包括:語音信息獲取步驟:通過語音控制終端獲取語音信息,并轉(zhuǎn)化為對應(yīng)的文本信息,所述語音信息中包括對數(shù)控系統(tǒng)的控制指令;指令序列生成步驟:將所述文本信息發(fā)送給云計算中心,并由所述云計算中心內(nèi)置的意圖識別模型解析生成指令序列,并將所述指令序列發(fā)送到數(shù)控系統(tǒng)控制器;指令執(zhí)行步驟:所述數(shù)控系統(tǒng)控制器接收所述指令序列,并根據(jù)指令序列依次執(zhí)行指令,控制所述數(shù)控系統(tǒng)。本發(fā)明提升了現(xiàn)有語音控制系統(tǒng)的靈活性、容錯性和安全性,簡化了用戶對數(shù)控系統(tǒng)的操作控制流程,降低了非專業(yè)人員操作數(shù)控系統(tǒng)的難度,擴大了數(shù)控系統(tǒng)的應(yīng)用場景。
技術(shù)領(lǐng)域
本發(fā)明涉及智能人機交互領(lǐng)域,具體地,涉及數(shù)控系統(tǒng)的遠程語音控制方法及系統(tǒng)。
背景技術(shù)
隨著控制算法和結(jié)構(gòu)設(shè)計的研究深入,數(shù)控系統(tǒng)的工作性能得到不斷提高,應(yīng)用場景得到不斷拓展,如超精密驅(qū)動平臺、數(shù)控機床等機電設(shè)備隨著技術(shù)的提高,能夠完成技術(shù)要求更高、流程更復(fù)雜的任務(wù)。與此同時,此類數(shù)控系統(tǒng)的操作控制也變得復(fù)雜精細,常常對某一簡單任務(wù)也需要復(fù)雜的程序輸入或參數(shù)配置,對實驗室研究人員和工業(yè)場景中工作人員的日常實驗和測試增加了操作上的復(fù)雜度,而對希望掌握此類設(shè)備操作技能的非專業(yè)人員更是加深了學(xué)習(xí)和培訓(xùn)的難度,使得此類數(shù)控系統(tǒng)因其復(fù)雜而精細的操控流程限制了使用范圍和操作效率。
隨著語音識別、自然語言處理和深度學(xué)習(xí)的快速發(fā)展,智能語音控制技術(shù)已經(jīng)逐漸應(yīng)用到生活的各個領(lǐng)域中并為人們帶來便利,例如,智能家居領(lǐng)域、語音控制智能機器人領(lǐng)域、智能音箱等。智能語音控制系統(tǒng)一般包括語音識別、自然語言處理、硬件底層智能控制等核心技術(shù)。
然而,在現(xiàn)有技術(shù)中,智能語音控制系統(tǒng)的應(yīng)用尚未涉及到與超精密驅(qū)動平臺、數(shù)控機床等數(shù)控系統(tǒng)結(jié)合。基于上述技術(shù)現(xiàn)狀,本發(fā)明將智能語音控制技術(shù)應(yīng)用于數(shù)控系統(tǒng)的控制,從而1)簡化和方便用戶對數(shù)控系統(tǒng)的操作控制,提高工作效率和作業(yè)的實時性以及安全性;2)為非技術(shù)人員提供操作數(shù)控系統(tǒng)的可行性,降低數(shù)控系統(tǒng)的操作難度;3)降低操控過程對“手”的依賴,實現(xiàn)口頭表達直接操控,擴大數(shù)控系統(tǒng)的應(yīng)用場景。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)中的缺陷,本發(fā)明的目的是提供一種數(shù)控系統(tǒng)的遠程語音控制方法及系統(tǒng)。
根據(jù)本發(fā)明提供的一種數(shù)控系統(tǒng)的遠程語音控制方法,包括:
語音信息獲取步驟:通過語音控制終端獲取語音信息,并轉(zhuǎn)化為對應(yīng)的文本信息,所述語音信息中包括對數(shù)控系統(tǒng)的控制指令;
指令序列生成步驟:將所述文本信息發(fā)送給云計算中心,并由所述云計算中心內(nèi)置的意圖識別模型解析生成指令序列,并將所述指令序列發(fā)送到數(shù)控系統(tǒng)控制器;
指令執(zhí)行步驟:所述數(shù)控系統(tǒng)控制器接收所述指令序列,并根據(jù)指令序列依次執(zhí)行指令,控制所述數(shù)控系統(tǒng)。
較佳的,還包括在所述語音信息獲取步驟之前,根據(jù)喚醒詞和聲紋識別用戶身份,并在用戶身份有效的情況下啟動所述語音信息獲取步驟。
較佳的,所述語音信息通過本地語音識別模型識別,或者通過云語音識別引擎識別。
較佳的,在所述云計算中心內(nèi)置的意圖識別模型解析生成指令序列之前,還包括:
獲取訓(xùn)練數(shù)據(jù),其中所述訓(xùn)練數(shù)據(jù)中包括多個意圖識別數(shù)據(jù)樣本對,每個意圖識別數(shù)據(jù)樣本對中包括,數(shù)控系統(tǒng)某一動作的文本表達和對應(yīng)的指令序列;
利用所述訓(xùn)練數(shù)據(jù),對預(yù)設(shè)的深度神經(jīng)網(wǎng)絡(luò)模型進行訓(xùn)練,生成意圖識別模型。
較佳的,所述將所述指令序列發(fā)送到數(shù)控系統(tǒng)控制器之后,還包括:
所述云計算中心將所述解析生產(chǎn)的所述指令序列發(fā)回至所述語音控制終端,并以文字、語音或文字和語音結(jié)合的形式展示;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海交通大學(xué),未經(jīng)上海交通大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811511399.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 銑床控制系統(tǒng)
- 車床控制系統(tǒng)
- 一種多臺數(shù)控系統(tǒng)之間的并行通訊裝置及通訊方法
- 一種基于專用U盤的數(shù)控系統(tǒng)參數(shù)保護方法
- 一種基于電機模擬加載的數(shù)控系統(tǒng)性能在線測試方法及系統(tǒng)
- 一種數(shù)控系統(tǒng)可靠性測試裝置
- 基于實時分層有限狀態(tài)機的計算機數(shù)控系統(tǒng)建模開發(fā)方法
- 一種加工中心雙數(shù)控系統(tǒng)控制電路
- 數(shù)控系統(tǒng)數(shù)據(jù)采集網(wǎng)關(guān)測試方法及設(shè)備
- 數(shù)控系統(tǒng)控制方法、裝置、數(shù)控系統(tǒng)及計算機存儲介質(zhì)
- 數(shù)據(jù)處理系統(tǒng)、微處理器以及處理指令的方法
- 處理器系統(tǒng)、指令序列優(yōu)化裝置和指令序列優(yōu)化程序
- 處理器、協(xié)處理器、信息處理系統(tǒng)及其方法
- 禁止已翻譯指令序列執(zhí)行的方法、裝置和虛擬機
- 指令序列確定的方法和相關(guān)設(shè)備及系統(tǒng)
- 具有可中斷指令序列的存儲器及其操作方法
- 一種低功耗程序指令編譯方法及系統(tǒng)
- 基于回調(diào)功能的程控指令自主執(zhí)行系統(tǒng)及方法
- 指令執(zhí)行序列的監(jiān)測方法及裝置、存儲介質(zhì)、計算機設(shè)備
- 一種基于工業(yè)防火墻的序列攻擊檢測實現(xiàn)方法





