[發明專利]一種基于K—均值聚類分析的人工智能語音分析方法在審
| 申請號: | 202211512555.5 | 申請日: | 2022-11-28 |
| 公開(公告)號: | CN115862639A | 公開(公告)日: | 2023-03-28 |
| 發明(設計)人: | 孫藝;彭偉;吳立楠;龍中武;徐懿 | 申請(專利權)人: | 北京智齒博創科技有限公司 |
| 主分類號: | G10L17/14 | 分類號: | G10L17/14;G10L17/02;G10L17/04;G06F18/23213;G06F18/214;G06F18/24 |
| 代理公司: | 北京冠和權律師事務所 11399 | 代理人: | 鄭延斌 |
| 地址: | 100000 北京市朝陽區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 均值 聚類分析 人工智能 語音 分析 方法 | ||
1.一種基于K—均值聚類分析的人工智能語音分析方法,其特征在于,包括:
建立語音分析模型,獲取訓練語音,對所述訓練語音進行語音處理,獲得訓練語音特征,并針對所述訓練語音特征采用K—均值聚類分析通過聚類分析建立語音分析模型;
采集輸入語音信息;
針對所述輸入語音信息進行語音處理,獲得語音特征;
將所述語音特征結合所述語音分析模型進行數據分析,獲得所述語音特征與所述語音分析模型的分析數據;
根據所述分析數據得到所述語音信息的分析識別結果。
2.根據權利要求1所述的人工智能語音分析方法,其特征在于,建立語音分析模型時,將所述訓練語音特征作為數據集進行聚類分析的,在數據集中,每條訓練語音對應的語音特征即為一個數據對象,聚類分析的過程包括:針對所述訓練語音進行分析確定聚類數目;在所述數據集中隨機選擇與所述聚類數目相等的數目的數據對象作為初始聚類中心;確定初始閾值;針對所述數據集中的數據對象計算所述數據對象到所述聚類中心的有效距離,并結合所述閾值尋找歸屬的所述初始聚類中心,得到數據分類;計算所述數據分類中每個數據簇的均值;更新所述每個數據簇的均值和所述閾值后繼續對數據集中的數據對象進行計算與分類,直至更新次數達到預設次數或者所述數據分類的目標函數滿足輸出條件時,輸出聚類分析結果。
3.根據權利要求2所述的人工智能語音分析方法,其特征在于,針對所述訓練語音進行分析確定聚類數目時,根據所述訓練語音的來源確定所述聚類數目;
所述閾值在更新時根據更新次數進行更新,而且更新后的閾值隨著更新次數的增加逐漸變大。
4.根據權利要求3所述的人工智能語音分析方法,其特征在于,針對所述數據集中的數據對象計算所述數據對象到所述聚類中心的有效距離時,采用歐式距離計算公式針對所述數據對象和所述聚類中心進行有效距離計算,而且在計算過程中參照維度進行計算。
5.根據權利要求4所述的人工智能語音分析方法,其特征在于,所述結合所述閾值尋找歸屬的所述初始聚類中心包括:根據所述閾值確定所述聚類中心的上下近似集;根據所述聚類中心的上下近似集針對所述有效距離進行判斷,確定所述數據對象是否在所述聚類中心的閾值有效范圍內,得到數據對象判斷結果;根據所述數據對象判斷結果得到數據分類。
6.根據權利要求5所述的人工智能語音分析方法,其特征在于,在更新每個數據簇的均值時,包括:在所述數據簇中確定一個基本集;將所述數據簇中聚類中心的上下近似集與所述數據簇確定的基本集進行比較,得到比較結果;根據比較結果針對所述數據簇采用不同的更新方式得到數據簇更新后的均值。
7.根據權利要求6所述的人工智能語音分析方法,其特征在于,所述目標函數是針對聚類分析過程中當前數據分類狀態的評價,在目標函數中,將數據對象與聚類中心在當前數據分類狀態下的相似度結合所述當前數據分類狀態中的第一權重值和第二權重值得到目標評價值,其中,所述第一權重值是所述當前數據分類狀態下所述聚類中心對應的數據簇的權重,所述第二權重值時所述當前狀態下數據對象在所述聚類中心對應的數據簇中的權重。
8.根據權利要求1所述的人工智能語音分析方法,其特征在于,針對所述語音信息進行語音處理,包括:通過高通濾波器對采集輸入的語音信息進行預加重處理,獲得第一處理語音信息;針對所述第一處理語音信息進行分幀處理,將所述第一處理語音信息按照幀分割,獲得第二處理語音信息;在所述第二處理語音信息中,針對每幀信息進行加窗處理,獲得第三處理語音信息;針對所述第三處理語音信息通過傅里葉變換確定所述語音信息在圖譜上的能量分析,得到語音信息幀的頻譜,并根據所述語音信息幀的頻譜得到語音信號的功率譜;采用三角帶通濾波器對所述語音信號功率譜進行濾波處理,同時計算所述三角帶通濾波器中每個濾波器組輸出的對數能量,并針對所述對數能量經過變換得到所述語音信息的語音特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京智齒博創科技有限公司,未經北京智齒博創科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211512555.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種動力電池高壓上電方法
- 下一篇:一種智能定位方法、裝置及智能定位系統





