[發(fā)明專利]一種機(jī)器人及其語音識(shí)別方法有效
| 申請(qǐng)?zhí)枺?/td> | 201710208533.2 | 申請(qǐng)日: | 2017-03-31 |
| 公開(公告)號(hào): | CN106847285B | 公開(公告)日: | 2020-05-05 |
| 發(fā)明(設(shè)計(jì))人: | 黃俊;劉英杰 | 申請(qǐng)(專利權(quán))人: | 上海思依暄機(jī)器人科技股份有限公司 |
| 主分類號(hào): | G10L15/22 | 分類號(hào): | G10L15/22;G10L15/26;G10L15/18 |
| 代理公司: | 北京信遠(yuǎn)達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 11304 | 代理人: | 魏曉波 |
| 地址: | 201207 上海市浦東新區(qū)中國*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 機(jī)器人 及其 語音 識(shí)別 方法 | ||
本發(fā)明提供一種機(jī)器人及其語音識(shí)別方法,在執(zhí)行語音識(shí)別或者語言合成的語音處理操作的同時(shí),實(shí)時(shí)監(jiān)測(cè)外界信息,以確定外界信息中是否存在喚醒信息;并在外界信息中存在喚醒信息的情況下,根據(jù)喚醒信息與控制指令之間的預(yù)設(shè)對(duì)應(yīng)關(guān)系,查找到與喚醒信息相對(duì)應(yīng)的控制指令;然后響應(yīng)控制指令,對(duì)用戶當(dāng)前輸入的語音進(jìn)行語音識(shí)別;也即,當(dāng)機(jī)器人正在進(jìn)行語音識(shí)別或者語言合成時(shí),一旦監(jiān)測(cè)到外界信息中存在喚醒信息,即對(duì)用戶當(dāng)前輸入的語音進(jìn)行語音識(shí)別,進(jìn)而對(duì)于用戶輸入的語音實(shí)現(xiàn)連續(xù)識(shí)別,確保能夠接收到用戶最新發(fā)出的語音命令或者語音詢問。
技術(shù)領(lǐng)域
本發(fā)明涉及機(jī)器人技術(shù)領(lǐng)域,尤其涉及一種機(jī)器人及其語音識(shí)別方法。
背景技術(shù)
語音識(shí)別技術(shù)是先將一段錄音轉(zhuǎn)換為文字,再對(duì)轉(zhuǎn)換成的文字進(jìn)行語義分析,通過語義分析生成語義答案,進(jìn)而實(shí)現(xiàn)對(duì)于語音的識(shí)別。
隨著科學(xué)技術(shù)的發(fā)展,人們的生活越來越智能化,機(jī)器人技術(shù)的應(yīng)用也越來越廣泛。當(dāng)前的機(jī)器人普遍應(yīng)用語音識(shí)別技術(shù)對(duì)接收的語音信息進(jìn)行轉(zhuǎn)換、分析,在得到語義答案后,即可執(zhí)行相應(yīng)的任務(wù)或者通過語言合成進(jìn)行語言答復(fù)。
但是當(dāng)前的機(jī)器人,在進(jìn)行語音識(shí)別或者語言合成的期間,若用戶再發(fā)出語音命令或者語音詢問,機(jī)器人將會(huì)保持當(dāng)前操作,而無法進(jìn)行連續(xù)語音識(shí)別,進(jìn)而錯(cuò)過用戶當(dāng)前的語音命令或者語音詢問。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提供了一種機(jī)器人及其語音識(shí)別方法,以解決現(xiàn)有技術(shù)中的機(jī)器人無法進(jìn)行連續(xù)語音識(shí)別的問題。
為實(shí)現(xiàn)上述目的,本申請(qǐng)?zhí)峁┑募夹g(shù)方案如下:
一種機(jī)器人的語音識(shí)別方法,所述方法包括:
在執(zhí)行語音處理操作的同時(shí),實(shí)時(shí)監(jiān)測(cè)外界信息;所述語音處理操作為:語音識(shí)別或者語言合成;
在所述外界信息中存在喚醒信息的情況下,根據(jù)所述喚醒信息與控制指令之間的預(yù)設(shè)對(duì)應(yīng)關(guān)系,查找到與所述喚醒信息相對(duì)應(yīng)的控制指令;所述控制指令至少包括對(duì)用戶當(dāng)前輸入的語音進(jìn)行語音識(shí)別;
響應(yīng)所述控制指令。
優(yōu)選的,所述實(shí)時(shí)監(jiān)測(cè)外界信息包括:實(shí)時(shí)監(jiān)聽外界環(huán)境中的語音信息;所述喚醒信息為:喚醒詞;
或者,所述實(shí)時(shí)監(jiān)測(cè)外界信息包括:實(shí)時(shí)采集外界環(huán)境中的圖像信息;所述喚醒信息為:喚醒手勢(shì)。
優(yōu)選的,所述控制指令,包括:
中斷所述語音處理操作,對(duì)所述用戶當(dāng)前輸入的語音進(jìn)行語音識(shí)別;
或者,維持所述語音處理操作,同時(shí)對(duì)所述用戶當(dāng)前輸入的語音進(jìn)行語音識(shí)別。
優(yōu)選的,所述對(duì)所述用戶當(dāng)前輸入的語音進(jìn)行語音識(shí)別,包括:
采集用戶當(dāng)前輸入的語音并生成錄音;
將所述錄音轉(zhuǎn)換為文字;
對(duì)所述文字進(jìn)行語義分析,得到語義答案。
優(yōu)選的,所述采集用戶當(dāng)前輸入的語音并生成錄音,包括:
采集用戶當(dāng)前輸入的語音并進(jìn)行錄制;
在采集完上一段語音之后的預(yù)設(shè)靜音段時(shí)長內(nèi),若未再采集到語音,則完成錄制,生成所述錄音。
一種機(jī)器人,包括處理器,所述處理器包括:
監(jiān)測(cè)模塊,用于在執(zhí)行語音處理操作的同時(shí),實(shí)時(shí)監(jiān)測(cè)外界信息;所述語音處理操作為:語音識(shí)別或者語言合成;
查找模塊,用于在所述外界信息中存在喚醒信息的情況下,根據(jù)所述喚醒信息與控制指令之間的預(yù)設(shè)對(duì)應(yīng)關(guān)系,查找到與所述喚醒信息相對(duì)應(yīng)的控制指令;所述控制指令至少包括對(duì)用戶當(dāng)前輸入的語音進(jìn)行語音識(shí)別;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海思依暄機(jī)器人科技股份有限公司,未經(jīng)上海思依暄機(jī)器人科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710208533.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





