[發(fā)明專利]用于生成語(yǔ)音樣本的方法、裝置、電子設(shè)備和介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202010082923.1 | 申請(qǐng)日: | 2020-02-07 |
| 公開(kāi)(公告)號(hào): | CN111292766B | 公開(kāi)(公告)日: | 2023-08-08 |
| 發(fā)明(設(shè)計(jì))人: | 蔡猛;梁鎮(zhèn)麟 | 申請(qǐng)(專利權(quán))人: | 抖音視界有限公司 |
| 主分類號(hào): | G10L25/51 | 分類號(hào): | G10L25/51;G10L15/06;G10L15/16;G10L15/07 |
| 代理公司: | 北京風(fēng)雅頌專利代理有限公司 11403 | 代理人: | 王剛 |
| 地址: | 100041 北京市石景山區(qū)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 生成 語(yǔ)音 樣本 方法 裝置 電子設(shè)備 介質(zhì) | ||
本公開(kāi)的實(shí)施例公開(kāi)了用于生成語(yǔ)音樣本的方法、裝置、電子設(shè)備和介質(zhì)。該方法的一具體實(shí)施方式包括:確定第一樣本語(yǔ)音和第二樣本語(yǔ)音之間的評(píng)分是否滿足第一預(yù)設(shè)要求,其中,該第一樣本語(yǔ)音、該第二樣本語(yǔ)音和第三樣本語(yǔ)音組成語(yǔ)音樣本;響應(yīng)于確定滿足,確定該第一樣本語(yǔ)音和該第三樣本語(yǔ)音之間的評(píng)分是否滿足第二預(yù)設(shè)要求;響應(yīng)于確定滿足,確定該語(yǔ)音樣本為目標(biāo)語(yǔ)音樣本。本公開(kāi)實(shí)施例的技術(shù)方案實(shí)現(xiàn)了可以更加容易的收集樣本,進(jìn)而增加了符合要求的樣本的數(shù)量。
技術(shù)領(lǐng)域
本公開(kāi)的實(shí)施例涉及計(jì)算機(jī)技術(shù)領(lǐng)域,具體涉及用于生成語(yǔ)音樣本的方法、裝置、電子設(shè)備和介質(zhì)。
背景技術(shù)
目前基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)音識(shí)別網(wǎng)絡(luò),對(duì)混響、環(huán)境噪聲、口音等人類無(wú)障礙就能識(shí)別合理變化的語(yǔ)音的識(shí)別,有著相當(dāng)大的性能衰減。這些問(wèn)題中的大部分都可通過(guò)在有大量數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)的情況下得到緩解。但是,大部分?jǐn)?shù)據(jù)會(huì)存在許多問(wèn)題,例如,口音。在這種情況下,大量的收集高質(zhì)量的數(shù)據(jù)集就會(huì)變得非常困難。
發(fā)明內(nèi)容
本部分用于以簡(jiǎn)要的形式介紹構(gòu)思,這些構(gòu)思將在后面的具體實(shí)施方式部分被詳細(xì)描述。本部分并不旨在標(biāo)識(shí)要求保護(hù)的技術(shù)方案的關(guān)鍵特征或必要特征,也不旨在用于限制所要求的保護(hù)的技術(shù)方案的范圍。
本公開(kāi)的一些實(shí)施例的目的在于提出一種改進(jìn)的用于生成語(yǔ)音樣本的方法、裝置、電子設(shè)備和介質(zhì),來(lái)解決以上背景技術(shù)部分提到的技術(shù)問(wèn)題。
第一方面,本公開(kāi)的一些實(shí)施例提供了一種用于生成語(yǔ)音樣本的方法,該方法包括:確定第一樣本語(yǔ)音和第二樣本語(yǔ)音之間的評(píng)分是否滿足第一預(yù)設(shè)要求,其中,上述第一樣本語(yǔ)音、上述第二樣本語(yǔ)音和第三樣本語(yǔ)音組成語(yǔ)音樣本;響應(yīng)于確定滿足,確定上述第一樣本語(yǔ)音和上述第三樣本語(yǔ)音之間的評(píng)分是否滿足第二預(yù)設(shè)要求;響應(yīng)于確定滿足,確定上述語(yǔ)音樣本為目標(biāo)語(yǔ)音樣本。
第二方面,本公開(kāi)的一些實(shí)施例提供了一種用于生成語(yǔ)音樣本的裝置,裝置包括:第一確定單元,被配置成確定第一樣本語(yǔ)音和第二樣本語(yǔ)音之間的評(píng)分是否滿足第一預(yù)設(shè)要求,其中,上述第一樣本語(yǔ)音、上述第二樣本語(yǔ)音和第三樣本語(yǔ)音組成語(yǔ)音樣本;第二確定單元,被配置成響應(yīng)于確定滿足,確定上述第一樣本語(yǔ)音和上述第三樣本語(yǔ)音之間的評(píng)分是否滿足第二預(yù)設(shè)要求;第三確定單元,被配置成響應(yīng)于確定滿足,確定上述語(yǔ)音樣本為目標(biāo)語(yǔ)音樣本。
第三方面,本公開(kāi)的一些實(shí)施例提供了一種電子設(shè)備,包括:一個(gè)或多個(gè)處理器;存儲(chǔ)裝置,其上存儲(chǔ)有一個(gè)或多個(gè)程序,當(dāng)一個(gè)或多個(gè)程序被一個(gè)或多個(gè)處理器執(zhí)行,使得一個(gè)或多個(gè)處理器實(shí)現(xiàn)如第一方面中任一的方法。
第四方面,本公開(kāi)的一些實(shí)施例提供了一種計(jì)算機(jī)可讀介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其中,程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面中任一的方法。
本公開(kāi)的上述各個(gè)實(shí)施例中的一個(gè)實(shí)施例具有如下有益效果:通過(guò)確定第一樣本語(yǔ)音與第二樣本語(yǔ)音之間的評(píng)分和第一樣本語(yǔ)音與第三樣本語(yǔ)音之間的評(píng)分是否滿足預(yù)設(shè)要求來(lái)得到符合訓(xùn)練要求的樣本,實(shí)現(xiàn)了可以更加容易的收集樣本,進(jìn)而增加了符合要求的樣本的數(shù)量。
附圖說(shuō)明
結(jié)合附圖并參考以下具體實(shí)施方式,本公開(kāi)各實(shí)施例的上述和其他特征、優(yōu)點(diǎn)及方面將變得更加明顯。貫穿附圖中,相同或相似的附圖標(biāo)記表示相同或相似的元素。應(yīng)當(dāng)理解附圖是示意性的,原件和元素不一定按照比例繪制。
圖1是根據(jù)本公開(kāi)的一些實(shí)施例的用于生成語(yǔ)音樣本的方法的一個(gè)應(yīng)用場(chǎng)景的示意圖;
圖2是根據(jù)本公開(kāi)的用于生成語(yǔ)音樣本的方法的一些實(shí)施例的流程圖;
圖3是根據(jù)本公開(kāi)的用于生成語(yǔ)音樣本的方法的又一些實(shí)施例的流程圖;
圖4是根據(jù)本公開(kāi)的用于生成語(yǔ)音樣本的裝置的一些實(shí)施例的結(jié)構(gòu)示意圖;
圖5是適于用來(lái)實(shí)現(xiàn)本公開(kāi)實(shí)施例的電子設(shè)備的計(jì)算機(jī)系統(tǒng)的結(jié)構(gòu)示意圖。
具體實(shí)施方式
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于抖音視界有限公司,未經(jīng)抖音視界有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010082923.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)
- 樣本引入裝置、樣本引入基片和樣本引入方法
- 樣本查找方法、裝置及系統(tǒng)
- 模型訓(xùn)練、樣本平衡方法及裝置以及個(gè)人信用評(píng)分系統(tǒng)
- 樣本輸送系統(tǒng)、樣本輸送方法以及樣本檢測(cè)系統(tǒng)
- 樣本分析裝置、樣本檢測(cè)設(shè)備及樣本檢測(cè)方法
- 樣本檢測(cè)方法、樣本檢測(cè)裝置及樣本檢測(cè)系統(tǒng)
- 樣本架、樣本混勻系統(tǒng)及樣本分析儀
- 樣本收集管及樣本收集系統(tǒng)
- 樣本數(shù)據(jù)集的擴(kuò)容方法及模型的訓(xùn)練方法
- 行人重識(shí)別的噪聲樣本識(shí)別方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)





