[發明專利]一種語音切分方法及裝置、計算機裝置和可讀存儲介質有效
| 申請號: | 201811208983.2 | 申請日: | 2018-10-17 |
| 公開(公告)號: | CN109448705B | 公開(公告)日: | 2021-01-29 |
| 發明(設計)人: | 張新;王慧君;毛躍輝;廖湖鋒;李保水;連園園;萬會 | 申請(專利權)人: | 珠海格力電器股份有限公司 |
| 主分類號: | G10L15/04 | 分類號: | G10L15/04;G10L15/22;G06K9/00 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 黃志華 |
| 地址: | 519070*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 切分 方法 裝置 計算機 可讀 存儲 介質 | ||
本發明公開了一種語音切分方法及裝置、計算機裝置和可讀存儲介質,其中,所述方法包括:采集獲得圖像;確定所述圖像所對應的智能家居場景;在所述智能家居場景下采集到音頻數據之后,確定所述智能家居場景對應的語音端點檢測的靈敏度;按照與所述靈敏度對應的音頻時長對所述音頻數據進行切分,確定待識別語音段。用于解決現有采用語音端點檢測的語音切分方法存在錯誤率高,語音識別效果差的技術問題。
技術領域
本發明涉及智能家居技術領域,特別涉及一種語音切分方法及裝置、計算機裝置和可讀存儲介質。
背景技術
語音端點檢測作為一種人機交互的手段,在解放人類雙手方面意義重大。
具體來講,語音端點檢測就是從連續的語音流中將有效語音(也就是說,人說話的聲音)的部分與外界的噪音或者是靜音分割開來,降低存儲或傳輸的數據量,以減少設備的計算負載,實現語音的快速識別。其主要包括兩個方面,檢測出有效語音的起始點即前端點,檢測出有效語音的結束點即后端點。
為了考察語音能量值的變化,需要先將語音信號按照固定時長比如20毫秒進行分割,每個分割單元稱為幀。每幀中包含數量相同的采樣點,然后計算每幀語音的能量值。如果音頻前面部分連續M0幀的能量值低于一個事先指定的能量值閾值E0,接下來的連續M0幀能量值大于E0,則能量值增大的地方為語音的前端點。如果連續的若干幀能量值較大,隨后的幀能量值變小,并且持續一定的時長,則能量值減小的地方為語音的后端點。其中,M0值的大小決定了語音端點檢測的靈敏度。M0值越小,音頻時長越短,語音端點檢測的靈敏度越高,反之,M0值越大,音頻時長越長,語音端點檢測的靈敏度越低。
此外,理想情況下靜音能量值為0。然而,采集音頻的場景中往往有一定強度的背景音,這種單純的背景音當然算靜音,但其能量值顯然不為0,因此,實際采集到的音頻其背景音通常有一定的基礎能量值。假設音頻起始處的一小段語音是靜音,在估計E0時,選取一定數量的幀(比如前100幀語音數據),計算其平均能量值,然后加上一個經驗值或乘以一個大于1的系數,由此得到E0,并將其作為判斷一幀語音是否是靜音的基準,大于這個值就是有效語音,小于這個值就是靜音。
現有語音識別設備常采用較為固定的語音端點檢測靈敏度,來切分語音。比如,不管是多人交流場景,還是單人交流場景,智能家居設備A的語音端點檢測的靈敏度始終為E0。然而,由于多人交流場景較單人交流場景,環境較為嘈雜,不易切分,仍采用固定的語音端點檢測的靈敏度E0來進行語音切分,很容易導致語音切分錯誤,進而導致語音識別錯誤。可見,采用固定的語音端點檢測的靈敏度E0來進行語音切分,切分結果時好時壞。
也就是說,現有采用語音端點檢測的語音切分方法存在錯誤率高,語音識別效果差的技術問題。
發明內容
本發明實施例提供一種語音切分方法及裝置、計算機裝置及可讀存儲介質,用于解決現有采用語音端點檢測的語音切分方法存在錯誤率高,語音識別效果差的技術問題。
第一方面,本發明實施例提供了一種語音切分方法,包括:
采集獲得圖像;
確定所述圖像所對應的智能家居場景;
在所述智能家居場景下采集到音頻數據之后,確定所述智能家居場景對應的語音端點檢測的靈敏度;
按照與所述靈敏度對應的音頻時長對所述音頻數據進行切分,確定待識別語音段。
在本發明實施例的技術方案中,通過采集圖像,進而確定該圖像所對應的智能家居場景,一旦在該智能家居場景下采集到音頻數據,便可以按照該智能家居場景所對應的語音端點檢測的靈敏度來對音頻數據進行切分,進而確定待識別語音段。也就是說,在對音頻數據進行切分時,根據智能家居場景自適應調整語音端點檢測的靈敏度,從而保證了對音頻數據的正確切分,改善了語音識別的識別效果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于珠海格力電器股份有限公司,未經珠海格力電器股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811208983.2/2.html,轉載請聲明來源鉆瓜專利網。





