[發(fā)明專利]一種智能語(yǔ)音交互打斷處理方法、裝置及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 202110407547.3 | 申請(qǐng)日: | 2021-04-15 |
| 公開(kāi)(公告)號(hào): | CN113113013B | 公開(kāi)(公告)日: | 2022-03-18 |
| 發(fā)明(設(shè)計(jì))人: | 牛歌 | 申請(qǐng)(專利權(quán))人: | 北京帝派智能科技有限公司 |
| 主分類號(hào): | G10L15/22 | 分類號(hào): | G10L15/22;G10L15/18 |
| 代理公司: | 北京弘權(quán)知識(shí)產(chǎn)權(quán)代理有限公司 11363 | 代理人: | 逯長(zhǎng)明;許偉群 |
| 地址: | 100080 北京市*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 智能 語(yǔ)音 交互 打斷 處理 方法 裝置 系統(tǒng) | ||
本申請(qǐng)?zhí)峁┝艘环N智能語(yǔ)音交互打斷處理方法、裝置及系統(tǒng),當(dāng)用戶需要打斷機(jī)器人正在播放目標(biāo)語(yǔ)音時(shí),向機(jī)器人發(fā)送打斷語(yǔ)音,此時(shí),機(jī)器人響應(yīng)于該打斷語(yǔ)音,確定所播放的當(dāng)前語(yǔ)音對(duì)應(yīng)的第一時(shí)間戳。為了保證當(dāng)前語(yǔ)音停止播放時(shí)的播放完整性,會(huì)預(yù)先在當(dāng)前語(yǔ)音中設(shè)置可打斷時(shí)間戳,以作為真正打斷播放語(yǔ)音的節(jié)點(diǎn)。當(dāng)機(jī)器人確定第一時(shí)間戳之后,需要根據(jù)第一時(shí)間戳確定相應(yīng)的可打斷時(shí)間戳,即第二時(shí)間戳,為了可以及時(shí)停止播放語(yǔ)音,選擇第一時(shí)間戳之后的第一個(gè)可打斷時(shí)間戳作為第二時(shí)間戳。這樣,通過(guò)將當(dāng)前語(yǔ)音持續(xù)播放至第二時(shí)間戳,不僅可以保證語(yǔ)音的播放完整性,還可以較為及時(shí)的停止播放當(dāng)前語(yǔ)音,以及時(shí)回應(yīng)用戶提出的其它需求。
技術(shù)領(lǐng)域
本申請(qǐng)涉及自然語(yǔ)言處理技術(shù)領(lǐng)域,尤其涉及一種智能語(yǔ)音交互打斷處理方法、裝置及系統(tǒng)。
背景技術(shù)
人機(jī)交互(human-computer interaction,HCI),又稱人機(jī)互動(dòng)(human-machineinteraction,HMI),是指用戶與系統(tǒng)之間的相互交流。利用人機(jī)交互可以有效減少人力成本,例如,在客戶服務(wù)領(lǐng)域,將人工客服替換為機(jī)器人,利用機(jī)器人與用戶語(yǔ)音對(duì)話,以解決用戶的一些問(wèn)題和需求,就可以有效減少人工數(shù)量。
為了提高用戶的體驗(yàn)感,需要令機(jī)器人語(yǔ)音的播放方式,例如語(yǔ)音內(nèi)容、播放語(yǔ)氣、語(yǔ)速、對(duì)于用戶語(yǔ)音的反應(yīng)力等,更加貼近于真人對(duì)話的模式,其中,對(duì)于用戶語(yǔ)音的反應(yīng)力,機(jī)器人很難模仿真人對(duì)話,例如,當(dāng)用戶不想繼續(xù)聽(tīng)機(jī)器人回復(fù)當(dāng)前問(wèn)題,就會(huì)向機(jī)器人發(fā)送語(yǔ)音,以打斷機(jī)器人播放當(dāng)前語(yǔ)音,通常,機(jī)器人在接收到用戶的語(yǔ)音信號(hào)時(shí),很難掌握停止播放當(dāng)前語(yǔ)音的打斷點(diǎn),在一些情況下,機(jī)器人會(huì)選擇立即或者隨機(jī)停止播放當(dāng)前語(yǔ)音,而這種打斷方式會(huì)導(dǎo)致已經(jīng)播放的語(yǔ)音的發(fā)音或者語(yǔ)義不完整,不符合真人對(duì)話的方式,令用戶感覺(jué)很生硬,體驗(yàn)感較差;在一些情況下,機(jī)器人為了提高已經(jīng)播放的語(yǔ)音的完整性,會(huì)選擇延長(zhǎng)語(yǔ)音播放時(shí)長(zhǎng),但是,這種打斷方式又會(huì)令當(dāng)前語(yǔ)音停止的不及時(shí),令用戶過(guò)長(zhǎng)等待,降低體驗(yàn)感。
發(fā)明內(nèi)容
本申請(qǐng)實(shí)施例提供了一種智能語(yǔ)音交互打斷處理方法、裝置及系統(tǒng),以通過(guò)準(zhǔn)確確定機(jī)器人停止播放當(dāng)前語(yǔ)音的打斷點(diǎn),提高用戶與機(jī)器人之間語(yǔ)音對(duì)話的體驗(yàn)感。
第一方面,本申請(qǐng)實(shí)施例提供了一種智能語(yǔ)音交互打斷處理方法,包括:接收用戶發(fā)送的打斷語(yǔ)音;獲取接收所述打斷語(yǔ)音時(shí)播放的當(dāng)前語(yǔ)音所對(duì)應(yīng)的第一時(shí)間戳;根據(jù)所述第一時(shí)間戳,確定第二時(shí)間戳,所述第二時(shí)間戳是指位于所述第一時(shí)間戳之后的第一個(gè)可打斷時(shí)間戳,所述可打斷時(shí)間戳用于指示停止播放所述當(dāng)前語(yǔ)音,且所述可打斷時(shí)間戳的設(shè)置符合預(yù)設(shè)的播放完整性規(guī)則;將所述當(dāng)前語(yǔ)音播放至所述第二時(shí)間戳。
在一種可以實(shí)現(xiàn)的方式中,所述接收用戶發(fā)送的打斷語(yǔ)音包括:接收用戶發(fā)送的語(yǔ)音信號(hào);根據(jù)預(yù)設(shè)規(guī)則,判斷所述語(yǔ)音信號(hào)是否為打斷語(yǔ)音;提取所述打斷語(yǔ)音。
在一種可以實(shí)現(xiàn)的方式中,所述預(yù)設(shè)規(guī)則包括所述語(yǔ)音信號(hào)對(duì)應(yīng)的音量大于或者等于預(yù)設(shè)音量,和/或所述語(yǔ)音信號(hào)對(duì)應(yīng)的語(yǔ)義符合預(yù)設(shè)用于指示停止播放語(yǔ)音的語(yǔ)義。
在一種可以實(shí)現(xiàn)的方式中,所述獲取接收所述打斷語(yǔ)音時(shí)播放的當(dāng)前語(yǔ)音所對(duì)應(yīng)的第一時(shí)間戳包括:識(shí)別接收所述打斷語(yǔ)音時(shí)播放的當(dāng)前語(yǔ)音對(duì)應(yīng)的已播放時(shí)間;確定所述已播放時(shí)間為第一時(shí)間戳。
在一種可以實(shí)現(xiàn)的方式中,所述根據(jù)所述第一時(shí)間戳,確定第二時(shí)間戳包括:獲取待分析語(yǔ)音,所述待分析語(yǔ)音是指從所述第一時(shí)間戳開(kāi)始至所述目標(biāo)語(yǔ)音的結(jié)尾的語(yǔ)音;根據(jù)預(yù)設(shè)的可打斷時(shí)間戳與字/詞/句子/語(yǔ)義的對(duì)應(yīng)關(guān)系,確定所述待分析語(yǔ)音中的全部可打斷時(shí)間戳;從所述全部可打斷時(shí)間戳中確定第二時(shí)間戳。
在一種可以實(shí)現(xiàn)的方式中,所述可打斷時(shí)間戳對(duì)應(yīng)預(yù)設(shè)字/詞/句子/語(yǔ)義的邊界。
在一種可以實(shí)現(xiàn)的方式中,所述當(dāng)前語(yǔ)音的每一個(gè)句子包含至少一個(gè)所述可打斷時(shí)間戳。
在一種可以實(shí)現(xiàn)的方式中,若所述當(dāng)前語(yǔ)音的目標(biāo)句子包含一個(gè)可打斷時(shí)間戳,所述可打斷時(shí)間戳對(duì)應(yīng)所述目標(biāo)句子的邊界。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京帝派智能科技有限公司,未經(jīng)北京帝派智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110407547.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)





