[發明專利]語音數據的提取方法和裝置無效

申請號：	201110454333.8	申請日：	2011-12-30
公開（公告）號：	CN102592592A	公開（公告）日：	2012-07-18
發明（設計）人：	程輝;王力劭;邵穎	申請（專利權）人：	深圳市車音網科技有限公司
主分類號：	G10L15/00	分類號：	G10L15/00
代理公司：	暫無信息	代理人：	暫無信息
地址：	518057 廣東省深圳市***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	語音數據提取方法裝置
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明涉及語音識別領域，尤其涉及一種語音數據的提取方法和裝置。

背景技術

隨著智能科技的發展，人類已經不再滿足于通過鼠標、按鍵等方式和設備進行交互，而是希望可以通過語音的方式與設備進行交互，實現設備的語音控制。語音識別技術作為語音交互技術的核心技術之一，已日趨成熟，并逐漸應用在信息處理、教育與商務應用、消費電子等領域。

語音數據提取是語音識別一個重要的輸入環節。用戶啟動語音裝置后，現有技術語音數據提取的過程包括：依次搜索用戶輸入的信號中的能量；根據該能量的位置從用戶輸入的信號中獲取語音數據。

然而，由于用戶輸入的信號中的能量可能來自于用戶發出的聲音，也可能來自環境中的工業生產、交通運輸等噪聲；如果語音數據提取時存在噪聲，該噪聲會被當作語音數據進行提取，造成語音識別不準確。

發明內容

本發明的實施例提供一種語音數據的提取方法和裝置，能夠提高語音識別的準確率。

一方面，提供了一種語音數據的提取方法，包括：獲取語音裝置所在環境的平均噪聲值；用戶啟動所述語音裝置后，根據預設時間對用戶輸入的信號進行分段，得到至少一個信號片段；根據所述至少一個信號片段對應的平均音頻值和所述平均噪聲值的關系，從所述用戶輸入的信號中獲取語音數據。

另一方面，提供了一種語音數據的提取裝置，包括：

噪聲值獲取單元，用于獲取語音裝置所在環境的平均噪聲值；

分段單元，用于用戶啟動所述語音裝置后，根據預設時間對用戶輸入的信號進行分段，得到至少一個信號片段；

數據提取單元，用于根據所述至少一個信號片段對應的平均音頻值和所述平均噪聲值的關系，從所述用戶輸入的信號中獲取語音數據。

本發明實施例提供的語音數據的提取方法和裝置，通過獲取語音裝置所在環境的平均噪聲值和至少一個信號片段，并根據該至少一個信號片段對應的平均音頻值和平均噪聲值的關系，從用戶輸入的信號中獲取語音數據，從而實現語音數據的提取。由于提取語音數據時，需要考慮至少一個信號片段對應的平均音頻值和平均噪聲值的關系，使得本發明實施例提供的技術方案能夠減少噪聲對語音數據提取的影響，從而提高語音識別的準確率；解決了現有技術中語音數據提取時存在噪聲，該噪聲會被當作語音數據進行提取，造成語音識別不準確的問題。

附圖說明

為了更清楚地說明本發明實施例或現有技術中的技術方案，下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本發明的一些實施例，對于本領域普通技術人員來講，在不付出創造性勞動的前提下，還可以根據這些附圖獲得其他的附圖。

圖1為本發明實施例一提供的語音數據的提取方法的流程圖；

圖2為本發明實施例二提供的語音數據的提取方法的流程圖；

圖3為本發明實施例三提供的語音數據的提取方法的流程圖；

圖4為本發明實施例四提供的語音數據的提取裝置的結構示意圖一；

圖5為本發明實施例四提供的語音數據的提取裝置的結構示意圖二；

圖6為圖4所示的語音數據的提取裝置中數據提取單元的結構示意圖；

圖7為圖6所示的語音數據的提取裝置中提取子單元的結構示意圖一；

圖8為圖6所示的語音數據的提取裝置中提取子單元的結構示意圖二；

圖9為圖6所示的語音數據的提取裝置中提取子單元的結構示意圖三。

具體實施方式

下面將結合本發明實施例中的附圖，對本發明實施例中的技術方案進行清楚、完整地描述，顯然，所描述的實施例僅僅是本發明一部分實施例，而不是全部的實施例。基于本發明中的實施例，本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例，都屬于本發明保護的范圍。

本發明實施例提供一種語音數據的提取方法和裝置，能夠解決現有技術造成語音識別不準確的問題。

如圖1所示，本發明實施例一提供的語音數據的提取方法，包括：

步驟101，獲取語音裝置所在環境的平均噪聲值。

在本實施例中，在語音裝置啟動之前，步驟101可以通過分貝檢測的方式檢測語音裝置所在環境各個時間點的噪聲值，并根據該各個時間點的噪聲值獲取平均噪聲值；步驟101還可以通過其他方式獲取語音裝置所在的環境的平均噪聲值，在此不再一一贅述；其中，語音裝置，既可以為具有語音錄入和傳輸功能的裝置，也可以為具有語音識別功能的裝置，還可以為其他裝置，在此不作限制。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于深圳市車音網科技有限公司，未經深圳市車音網科技有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201110454333.8/2.html，轉載請聲明來源鉆瓜專利網。