[發明專利]樣本篩選方法及電子設備在審

申請號：	202010558607.7	申請日：	2020-06-18
公開（公告）號：	CN113903340A	公開（公告）日：	2022-01-07
發明（設計）人：	楊曉帆;馮大航;陳孝良	申請（專利權）人：	北京聲智科技有限公司
主分類號：	G10L15/26	分類號：	G10L15/26;G10L15/06;G10L25/51
代理公司：	北京銀龍知識產權代理有限公司 11243	代理人：	黃燦;左曉菲
地址：	100098 北京市***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	樣本篩選方法電子設備
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明提供一種樣本篩選方法及電子設備，所述方法包括：對語音樣本集中每個語音樣本進行語音識別；將所述每個語音樣本的語音識別結果分別與預設文本進行比對，得到所述每個語音樣本對應的比對結果；基于所述每個語音樣本對應的比對結果對所述語音樣本集進行樣本篩選。本發明實施例能夠提高訓練的模型的準確性。

技術領域

本發明涉及數據處理技術領域，尤其涉及一種樣本篩選方法及電子設備。

背景技術

隨著物聯網技術的發展，智能家居越來越受到人們的歡迎。智能家居通過物聯網將各種設備連接到一起，提供家電控制、照明控制、室內外遙控等多種功能和手段。通常采用語音方式實現人與智能家居設備的交互。

為實現人與智能家居設備之間的語音交互，需要采用語音訓練樣本對智能家居設備進行模型訓練。目前，采用人工錄制的語音進行模型訓練，然而，人工錄制的語音，可能會存在截斷、錄制人說錯、錄制被打斷等問題。采用不準確的語音訓練樣本進行模型訓練會導致訓練的模型準確性較低。

發明內容

本發明實施例提供一種樣本篩選方法及電子設備，以解決現有技術中采用不準確的語音訓練樣本進行模型訓練會導致訓練的模型準確性較低的問題。

為了解決上述技術問題，本發明是這樣實現的：

第一方面，本發明實施例提供了一種樣本篩選方法，應用于電子設備，所述方法包括：

對語音樣本集中每個語音樣本進行語音識別；

將所述每個語音樣本的語音識別結果分別與預設文本進行比對，得到所述每個語音樣本對應的比對結果；

基于所述每個語音樣本對應的比對結果對所述語音樣本集進行樣本篩選。

第二方面，本發明實施例提供了一種電子設備，所述電子設備包括：

識別模塊，用于對語音樣本集中每個語音樣本進行語音識別；

比對模塊，用于將所述每個語音樣本的語音識別結果分別與預設文本進行比對，得到所述每個語音樣本對應的比對結果；

篩選模塊，用于基于所述每個語音樣本對應的比對結果對所述語音樣本集進行樣本篩選。

第三方面，本發明實施例提供了一種電子設備，包括：存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的程序，所述程序被所述處理器執行時實現如第一方面所述的樣本篩選方法中的步驟。

第四方面，本發明實施例提供了一種計算機可讀存儲介質，所述計算機可讀存儲介質上存儲有計算機程序，所述計算機程序被處理器執行時實現如第一方面所述的樣本篩選方法中的步驟。

本發明實施例中，對語音樣本集中每個語音樣本進行語音識別；將所述每個語音樣本的語音識別結果分別與預設文本進行比對，得到所述每個語音樣本對應的比對結果；基于所述每個語音樣本對應的比對結果對所述語音樣本集進行樣本篩選。這樣，通過將所述每個語音樣本的語音識別結果分別與預設文本進行比對，從而對所述語音樣本集進行樣本篩選，能夠篩選掉不準確的語音訓練樣本，從而能夠提高訓練的模型的準確性。

附圖說明

為了更清楚地說明本發明實施例的技術方案，下面將對本發明實施例描述中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本發明的一些實施例，對于本領域普通技術人員來講，在不付出創造性勞動性的前提下，還可以根據這些附圖獲得其他的附圖。

圖1是本發明實施例提供的一種樣本篩選方法的流程圖；

圖2是本發明實施例提供的一種電子設備的結構示意圖之一；

圖3是本發明實施例提供的一種電子設備的結構示意圖之二；

圖4是本發明實施例提供的一種電子設備的結構示意圖之三；

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京聲智科技有限公司，未經北京聲智科技有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202010558607.7/2.html，轉載請聲明來源鉆瓜專利網。