[發(fā)明專利]處理并發(fā)語(yǔ)音有效
| 申請(qǐng)?zhí)枺?/td> | 201380053617.3 | 申請(qǐng)日: | 2013-09-13 |
| 公開(kāi)(公告)號(hào): | CN104756473B | 公開(kāi)(公告)日: | 2017-08-29 |
| 發(fā)明(設(shè)計(jì))人: | 瑟奇·拉沙佩勒;亞歷山大·謝爾多斯 | 申請(qǐng)(專利權(quán))人: | 谷歌公司 |
| 主分類號(hào): | H04M3/56 | 分類號(hào): | H04M3/56;G10L21/00 |
| 代理公司: | 中原信達(dá)知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司11219 | 代理人: | 周亞榮,安翔 |
| 地址: | 美國(guó)加利*** | 國(guó)省代碼: | 暫無(wú)信息 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 處理 并發(fā) 語(yǔ)音 | ||
1.一種用于處理并發(fā)語(yǔ)音的方法,包括:
在包括一個(gè)或多個(gè)處理器和存儲(chǔ)用于由所述一個(gè)或多個(gè)處理器執(zhí)行的一個(gè)或多個(gè)程序的存儲(chǔ)器的系統(tǒng)處:
從會(huì)話的第一參與者接收語(yǔ)音數(shù)據(jù);
從所述會(huì)話的第二參與者接收語(yǔ)音數(shù)據(jù);
確定所述第二參與者的語(yǔ)音是否與所述第一參與者的語(yǔ)音在時(shí)間上重疊,其中
當(dāng)所述第二參與者的語(yǔ)音不與所述第一參與者的語(yǔ)音在時(shí)間上重疊時(shí),輸出所述第一參與者的語(yǔ)音,并且然后輸出所述第二參與者的語(yǔ)音,
當(dāng)所述第二參與者的語(yǔ)音與所述第一參與者的語(yǔ)音在時(shí)間上重疊時(shí),確定所述第二參與者的語(yǔ)音與所述第一參與者的語(yǔ)音重疊的量,其中
當(dāng)所述重疊少于所述第一參與者的語(yǔ)音的末端部分的第一預(yù)定閾值量時(shí),根據(jù)對(duì)所述會(huì)話的一個(gè)或多個(gè)參與者的語(yǔ)音的調(diào)整輸出所述第一參與者的語(yǔ)音,并且然后輸出所述第二參與者的語(yǔ)音,根據(jù)對(duì)所述會(huì)話的所述一個(gè)或多個(gè)參與者的語(yǔ)音的調(diào)整輸出所述第二參與者的語(yǔ)音包括延遲所述第二參與者的語(yǔ)音的輸出;以及
當(dāng)所述重疊多于所述第一參與者的語(yǔ)音的末端部分的所述第一預(yù)定閾值量時(shí),輸出所述第一參與者的語(yǔ)音,并且選擇性地丟棄所述第二參與者的語(yǔ)音。
2.如權(quán)利要求1所述的方法,其中,延遲所述第二參與者的語(yǔ)音的輸出包括:延遲所述第二參與者的語(yǔ)音的輸出,直到已經(jīng)輸出所述第一參與者的語(yǔ)音。
3.如權(quán)利要求1所述的方法,其中,延遲所述第二參與者的語(yǔ)音的輸出包括:延遲所述第二參與者的語(yǔ)音的輸出,直到所述第一參與者的語(yǔ)音中出現(xiàn)暫停。
4.如權(quán)利要求1所述的方法,其中,延遲所述第二參與者的語(yǔ)音的輸出包括:根據(jù)所述第二參與者和所述第一參與者之間的關(guān)系來(lái)延遲所述第二參與者的語(yǔ)音的輸出。
5.如權(quán)利要求1所述的方法,其中,延遲所述第二參與者的語(yǔ)音的輸出包括:根據(jù)所述第二參與者的語(yǔ)音的內(nèi)容的分類來(lái)延遲所述第二參與者的語(yǔ)音的輸出。
6.如權(quán)利要求5所述的方法,其中,所述第二參與者的語(yǔ)音的內(nèi)容的分類是通過(guò)語(yǔ)音識(shí)別和對(duì)所述第二參與者的語(yǔ)音的內(nèi)容的轉(zhuǎn)錄來(lái)完成的。
7.如權(quán)利要求1所述的方法,其中,延遲所述第二參與者的語(yǔ)音的輸出包括:響應(yīng)于在所述會(huì)話中識(shí)別到提示而輸出所述第二參與者的語(yǔ)音。
8.如權(quán)利要求2-7中任何一項(xiàng)所述的方法,其中,延遲所述第二參與者的語(yǔ)音的輸出包括:響應(yīng)于用戶輸入而輸出所述第二參與者的語(yǔ)音。
9.如權(quán)利要求1-7中任何一項(xiàng)所述的方法,其中,根據(jù)對(duì)所述會(huì)話的參與者的語(yǔ)音的調(diào)整輸出所述第二參與者的語(yǔ)音包括:加速所述第一參與者的語(yǔ)音。
10.如權(quán)利要求9所述的方法,其中,加速所述第一參與者的語(yǔ)音包括:使用音頻時(shí)間標(biāo)度-基音修改算法來(lái)加快所述第一參與者的語(yǔ)音。
11.如權(quán)利要求9所述的方法,其中,加速所述第一參與者的語(yǔ)音包括:縮短或去除所述第一參與者的語(yǔ)音內(nèi)的一個(gè)或多個(gè)暫停。
12.如權(quán)利要求1-7中任何一項(xiàng)所述的方法,其中,對(duì)所述會(huì)話的參與者的語(yǔ)音的調(diào)整包括:(i)當(dāng)所述第一參與者的語(yǔ)音的長(zhǎng)度超出預(yù)定時(shí)間閾值時(shí),切斷所述第一參與者的語(yǔ)音,以及(ii)當(dāng)所述第一參與者的語(yǔ)音已被切斷時(shí),輸出所述第二參與者的語(yǔ)音。
13.如權(quán)利要求1-7中任何一項(xiàng)所述的方法,所述方法進(jìn)一步包括:
從所述會(huì)話的第三參與者接收語(yǔ)音數(shù)據(jù),其中,所述第三參與者的語(yǔ)音至少部分地與所述第一參與者的語(yǔ)音和所述第二參與者的語(yǔ)音在時(shí)間上重疊;以及
對(duì)所述會(huì)話的一個(gè)或多個(gè)參與者的語(yǔ)音的調(diào)整進(jìn)一步包括:當(dāng)所述會(huì)話中所述第二參與者的優(yōu)先級(jí)高于所述第三參與者的優(yōu)先級(jí)時(shí),在所述第三參與者的語(yǔ)音之前輸出所述第二參與者的語(yǔ)音。
14.如權(quán)利要求13所述的方法,其中,所述第二參與者的優(yōu)先級(jí)和所述第三參與者的優(yōu)先級(jí)是基于FIFO、基于角色、基于社交網(wǎng)絡(luò)狀態(tài)或投票數(shù)來(lái)確定的。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于谷歌公司,未經(jīng)谷歌公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201380053617.3/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)





