[發(fā)明專利]基于單耳機(jī)語音對(duì)話過程捂嘴手勢(shì)的識(shí)別方法在審
| 申請(qǐng)?zhí)枺?/td> | 202011131532.0 | 申請(qǐng)日: | 2020-10-21 |
| 公開(公告)號(hào): | CN112133313A | 公開(公告)日: | 2020-12-25 |
| 發(fā)明(設(shè)計(jì))人: | 喻純;李竹 | 申請(qǐng)(專利權(quán))人: | 交互未來(北京)科技有限公司 |
| 主分類號(hào): | G10L17/22 | 分類號(hào): | G10L17/22;G10L15/25;G10L15/22;G06K9/00;H04M1/725 |
| 代理公司: | 北京君莫知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11715 | 代理人: | 崔云鶴 |
| 地址: | 100015 北京市朝陽區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 耳機(jī) 語音 對(duì)話 過程 手勢(shì) 識(shí)別 方法 | ||
本發(fā)明提出基于單耳機(jī)語音對(duì)話過程捂嘴手勢(shì)的識(shí)別方法,包括如下步驟:通過雙模藍(lán)牙通信組件,建立單耳機(jī)與交互式移動(dòng)終端之間的無線連接;通過所述單耳機(jī)的第一麥克風(fēng)通道和第二麥克風(fēng)通道接收語音輸入信號(hào);分析所述第一麥克風(fēng)通道和第二麥克風(fēng)通道各自接收的語音輸入信號(hào)的差異,識(shí)別所述語音輸入過程中是否存在捂嘴操作;如果存在捂嘴操作,則通過所述雙模藍(lán)牙通信組件向所述交互性移動(dòng)終端發(fā)出控制指令。本發(fā)明的技術(shù)方案可以簡化用戶進(jìn)行語音輸入時(shí)的喚醒過程,在進(jìn)行語音輸入時(shí)只需維持單手捂嘴手勢(shì),便可免除說喚醒詞或者觸摸設(shè)備等的界面喚醒步驟,同時(shí)捂嘴手勢(shì)可以有效保護(hù)用戶語音對(duì)話過程的隱私,提高交互效率與交互自然性。
技術(shù)領(lǐng)域
本發(fā)明屬于人機(jī)智能交互技術(shù)領(lǐng)域,尤其涉及一種基于單耳機(jī)語音對(duì)話過程捂嘴手勢(shì)的識(shí)別方法。
背景技術(shù)
手勢(shì)交互、觸控交互和語音交互是當(dāng)下主要的3種交互方式。語音交互需要用戶能進(jìn)行聽和說;觸控交互需要用戶能和設(shè)備進(jìn)行接觸;手勢(shì)交互需要用戶的手能自由移動(dòng)。但在一些場(chǎng)景下,用戶并沒有條件進(jìn)行上述交互行為。以醫(yī)生為例,可能在他已經(jīng)對(duì)雙手進(jìn)行嚴(yán)格消毒后,仍需要查看病人的相關(guān)資料。但是他無法確保,所有的屏幕、X光片、檔案等都是干凈的。這時(shí)如果能通過非接觸的手勢(shì)或語音進(jìn)行操作,就不會(huì)有被污染的風(fēng)險(xiǎn)。
然而,進(jìn)行語音交互時(shí),用戶需要把指令說出來。這其中最主要的實(shí)現(xiàn)技術(shù)就是喚醒詞。當(dāng)只有自己一人時(shí),說些什么可能都沒有關(guān)系。但當(dāng)人多起來時(shí),尤其是不熟悉的人多起來時(shí),當(dāng)眾說一些東西會(huì)讓用戶覺得自己很傻,并且還涉及到隱私保護(hù)的問題。現(xiàn)有技術(shù)中所有的語音助手,都還是被動(dòng)地交談,你必須給出命令,它們才會(huì)應(yīng)答。例如,智能音箱。當(dāng)人正在與他人進(jìn)行交流時(shí),使用語音進(jìn)行交互是一件打斷性非常強(qiáng)的事情。例如幾個(gè)人聊天聊得正嗨,想要播放音樂或調(diào)解燈光來營造氣氛,突然來一句″小x同學(xué),播放音樂”會(huì)顯得很突兀。
為解決上述技術(shù)問題,本申請(qǐng)人先前提交了幾份專利申請(qǐng),在如下四個(gè)方面上提出了多項(xiàng)新的技術(shù)方案:1、基于人類說話時(shí)風(fēng)噪聲特征的語音輸入觸發(fā),具體地,通過識(shí)別人說話時(shí)候的語音和風(fēng)噪聲音來直接啟動(dòng)語音輸入并將接收的聲音信號(hào)作為語音輸入處理;2、基于多個(gè)麥克風(fēng)接收的聲音信號(hào)的差別的語音輸入觸發(fā);3、基于低聲說話方式識(shí)別的語音輸入觸發(fā);4、基于麥克風(fēng)的聲音信號(hào)的距離判斷的語音輸入觸發(fā),相關(guān)專利申請(qǐng)公開案號(hào)為CN110262767A、CN110223711A、CN110428806A、CN110111776A、CN110097875A、CN110164440A,本文將這幾篇專利文獻(xiàn)全文并入,作為本公開的內(nèi)容。
進(jìn)一步的,中國發(fā)明專利申請(qǐng)CN202010198596.6提出能夠識(shí)別用戶捂嘴手勢(shì)下發(fā)聲的單耳耳機(jī)、智能電子便攜設(shè)備和語音交互喚醒方法。單耳耳機(jī)具有耳內(nèi)麥克風(fēng)和耳外麥克風(fēng),以及具有一塊電路板,電路板上具有存儲(chǔ)器和處理器,存儲(chǔ)器上存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令,計(jì)算機(jī)可執(zhí)行指令被處理器執(zhí)行時(shí)能夠執(zhí)行如下操作:接收所述耳內(nèi)麥克風(fēng)和耳外麥克風(fēng)采集的信號(hào);分析耳內(nèi)麥克風(fēng)和耳外麥克風(fēng)采集的信號(hào),識(shí)別用戶是否在做捂嘴手勢(shì)的狀態(tài)下發(fā)聲。所述識(shí)別結(jié)果可以觸發(fā)語音輸入。
本申請(qǐng)是針對(duì)上述問題的進(jìn)一步改進(jìn)型發(fā)明,相比于已有的方案,本發(fā)明的技術(shù)方案進(jìn)一步解決了用戶隱私保護(hù)問題,并且簡化用戶進(jìn)行語音輸入時(shí)的喚醒過程,在進(jìn)行語音輸入時(shí)只需維持單手捂嘴手勢(shì),便可免除說喚醒詞或者觸摸設(shè)備等的界面喚醒步驟,同時(shí)捂嘴手勢(shì)可以有效保護(hù)用戶語音對(duì)話過程的隱私,提高交互效率與交互自然性。
發(fā)明內(nèi)容
本發(fā)明提出基于單耳機(jī)語音對(duì)話過程捂嘴手勢(shì)的識(shí)別方法,包括如下步驟:通過雙模藍(lán)牙通信組件,建立單耳機(jī)與交互式移動(dòng)終端之間的無線連接;通過所述單耳機(jī)的第一麥克風(fēng)通道和第二麥克風(fēng)通道接收語音輸入信號(hào);分析所述第一麥克風(fēng)通道和第二麥克風(fēng)通道各自接收的語音輸入信號(hào)的差異,識(shí)別所述語音輸入過程中是否存在捂嘴操作;如果存在捂嘴操作,則通過所述雙模藍(lán)牙通信組件向所述交互性移動(dòng)終端發(fā)出控制指令。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于交互未來(北京)科技有限公司,未經(jīng)交互未來(北京)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011131532.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種污水處理裝置
- 下一篇:一種用于斗柜防倒支撐裝置
- 對(duì)話控制裝置、對(duì)話控制方法以及記錄介質(zhì)
- 任務(wù)對(duì)話系統(tǒng)中的對(duì)話處理方法及裝置
- 一種人機(jī)對(duì)話的方法、裝置和存儲(chǔ)介質(zhì)
- 對(duì)話(中)獎(jiǎng)勵(lì)評(píng)估和對(duì)話方法、介質(zhì)、裝置和計(jì)算設(shè)備
- 一種對(duì)話方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 一種輔助英文對(duì)話的方法及系統(tǒng)
- 一種回復(fù)對(duì)話評(píng)分模型訓(xùn)練方法、對(duì)話回復(fù)方法及其裝置
- 一種多輪對(duì)話的問題定位方法及裝置
- 文本對(duì)話方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 對(duì)話型文本分類方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)





