[發(fā)明專利]數(shù)據(jù)篩選方法、裝置及智能音箱有效
| 申請?zhí)枺?/td> | 201910547514.1 | 申請日: | 2019-06-21 |
| 公開(公告)號: | CN110288976B | 公開(公告)日: | 2021-09-07 |
| 發(fā)明(設(shè)計)人: | 陳孝良;楊曉帆;馮大航 | 申請(專利權(quán))人: | 北京聲智科技有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/06;G10L15/08 |
| 代理公司: | 中科專利商標(biāo)代理有限責(zé)任公司 11021 | 代理人: | 任巖 |
| 地址: | 100086 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)據(jù) 篩選 方法 裝置 智能 音箱 | ||
本公開提供了一種數(shù)據(jù)篩選方法,包括:按照預(yù)設(shè)的篩選條件對待篩選數(shù)據(jù)進行數(shù)據(jù)篩選,得到目標(biāo)數(shù)據(jù);將所述目標(biāo)數(shù)據(jù)進行訓(xùn)練,更新聲學(xué)模型。本公開根據(jù)預(yù)設(shè)的篩選條件篩選數(shù)據(jù),確定精確率高的目標(biāo)數(shù)據(jù),然后利用目標(biāo)數(shù)據(jù)訓(xùn)練并更新聲學(xué)模型,且經(jīng)過多次迭代的篩選,在節(jié)省人力的情況下盡可能的保證數(shù)據(jù)質(zhì)量,提高效率。
技術(shù)領(lǐng)域
本公開涉及數(shù)據(jù)篩選領(lǐng)域,尤其涉及一種數(shù)據(jù)篩選方法、裝置及智能音箱。
背景技術(shù)
隨著語音識別技術(shù)和人工智能的快速發(fā)展,人工智能產(chǎn)品越來越普及,例如智能音箱,自動駕駛、圖像識別、智能書柜、聊天機器人、虛擬現(xiàn)實眼鏡等都得到了廣泛范圍。而智能音箱作為使用最廣泛的智能產(chǎn)品,在用戶的使用過程中,有些產(chǎn)品往往存在用戶的使用體驗感不好的情況,其主要原因是數(shù)據(jù)的數(shù)量以及質(zhì)量沒有得到很好的篩選。
因此,需要一種新的數(shù)據(jù)篩選方法,方便自動準(zhǔn)確地分出有效數(shù)據(jù)和無效數(shù)據(jù)。
公開內(nèi)容
(一)要解決的技術(shù)問題
本公開的目的在于提供一種數(shù)據(jù)篩選方法、裝置及智能音箱,以解決上述的至少一項技術(shù)問題。
(二)技術(shù)方案
根據(jù)本公開實施例的第一方面,提供一種數(shù)據(jù)篩選方法,包括:
按照預(yù)設(shè)的篩選條件對待篩選數(shù)據(jù)進行數(shù)據(jù)篩選,得到目標(biāo)數(shù)據(jù);
將所述目標(biāo)數(shù)據(jù)進行訓(xùn)練,更新聲學(xué)模型。
在本公開的一些實施例中,按照預(yù)設(shè)的篩選條件對待篩選數(shù)據(jù)進行數(shù)據(jù)篩選,得到目標(biāo)數(shù)據(jù),包括:
對所述待篩選數(shù)據(jù)進行音素位置標(biāo)記;
根據(jù)標(biāo)記后的音素確定待篩選數(shù)據(jù)是否滿足篩選條件,若所述待篩選數(shù)據(jù)滿足所述篩選條件,則將所述待篩選數(shù)據(jù)劃分為目標(biāo)數(shù)據(jù);否則,確定所述待篩選數(shù)據(jù)不滿足所述篩選條件,并刪除所述待篩選數(shù)據(jù)。
在本公開的一些實施例中,根據(jù)標(biāo)記后的音素確定待篩選數(shù)據(jù)是否滿足篩選條件,包括:
判斷所述待篩選數(shù)據(jù)中是否包括預(yù)定詞的預(yù)定音素,若所述待篩選數(shù)據(jù)中包括所述預(yù)定音素,則判斷所述標(biāo)記后的音素的順序是否與所述預(yù)定音素的順序相同,若所述標(biāo)記后的音素的順序與所述預(yù)定音素的順序相同,則確定所述待篩選數(shù)據(jù)滿足所述篩選條件;否則,確定所述待篩選數(shù)據(jù)不滿足所述篩選條件。
在本公開的一些實施例中,根據(jù)標(biāo)記后的音素確定待篩選數(shù)據(jù)是否滿足篩選條件,包括:
根據(jù)所述標(biāo)記后的音素標(biāo)記,確定所述待篩選數(shù)據(jù)的音素個數(shù)和時間長度;
根據(jù)所述待篩選數(shù)據(jù)的音素個數(shù)和時間長度,判斷所述待篩選數(shù)據(jù)是否滿足篩選條件。
在本公開的一些實施例中,根據(jù)所述待篩選數(shù)據(jù)的音素個數(shù)和時間長度,判斷所述待篩選數(shù)據(jù)是否滿足篩選條件,包括:
判斷預(yù)定詞的音素個數(shù)是否與所述待篩選數(shù)據(jù)的音素個數(shù)相同,若預(yù)定詞的音素個數(shù)與所述待篩選數(shù)據(jù)的音素個數(shù)相同,則判斷所述待篩選數(shù)據(jù)的時間長度是否在預(yù)定時間內(nèi),若所述待篩選數(shù)據(jù)的時間長度在預(yù)定時間內(nèi),則確定所述待篩選數(shù)據(jù)滿足所述篩選條件;否則,確定所述待篩選數(shù)據(jù)不滿足所述篩選條件。
在本公開的一些實施例中,根據(jù)標(biāo)記后的音素確定待篩選數(shù)據(jù)是否滿足篩選條件,包括:
判斷所述待篩選數(shù)據(jù)中每兩個字之間的停頓時間是否在預(yù)定停頓時間內(nèi),若停頓時間在所述預(yù)定停頓時間內(nèi),則確定所述待篩選數(shù)據(jù)滿足所述篩選條件;否則,確定所述待篩選數(shù)據(jù)不滿足所述篩選條件。
在本公開的一些實施例中,對所述待篩選數(shù)據(jù)進行音素位置標(biāo)記,包括:
讀取所述待篩選數(shù)據(jù)中的音頻數(shù)據(jù);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京聲智科技有限公司,未經(jīng)北京聲智科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910547514.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





