[發明專利]語音聲調的識別方法和裝置無效
| 申請號: | 201210088946.9 | 申請日: | 2012-03-29 |
| 公開(公告)號: | CN103366736A | 公開(公告)日: | 2013-10-23 |
| 發明(設計)人: | 韓衛生;謝凌云;潘興德;章斯宇;孟子厚 | 申請(專利權)人: | 北京中傳天籟數字技術有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02 |
| 代理公司: | 北京億騰知識產權代理事務所 11309 | 代理人: | 陳霽 |
| 地址: | 100024 北京市朝陽區建*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 聲調 識別 方法 裝置 | ||
技術領域
本發明涉及一種語音聲調的識別方法和裝置,尤其涉及一種基于語言生態學的語音聲調的識別方法和裝置。
背景技術
近年來,隨著語音識別等語音學技術的進步,計算機輔助語言學習技術作為一個全新的交叉學科研究課題逐漸受到學術界和教育界的關注。
現有的運用計算機進行普通話水平測試和指導學習的方法采用了以音段為單位建立普通話水平測試評分機制,采用語音識別的方法,計算參加普通話水平考試考生的得分,并指出考生的發音錯誤。
但是現有技術中對于聲調識別方法的誤識別率比較高,由此影響漢語語音的學習。
發明內容
本發明的目的是針對現有技術的缺陷,提供了一種語音聲調的識別方法和裝置,可以有效的對語音的聲調進行識別,從而有利于漢語語音的學習。
為實現上述目的,本發明提供了一種語音聲調的識別方法,所述方法包括:
采集語音數據;
將所述語音數據中的音節的基音序列進行分割,分別得到第一子基音序列、第二子基音序列和第三子基音序列;
將所述第一子基音序列、第二子基音序列和第三子基音序列分別取均值/中值,得到第一子均值/中值、第二子均值/中值和第三子均值/中值;
根據所述第一子均值/中值、第二子均值/中值和第三子均值/中值判斷語音聲調。
為實現上述目的,本發明提供了一種語音聲調的識別裝置,所述裝置包括:
采集單元,用于采集語音數據;
分割單元,用于將所述語音數據中的音節的基音序列進行分割,分別得到第一子基音序列、第二子基音序列和第三子基音序列;
取平均單元,用于將所述第一子基音序列、第二子基音序列和第三子基音序列分別取均值/中值,得到第一子均值/中值、第二子均值/中值和第三子均值/中值;
判斷單元,用于根據所述第一子均值/中值、第二子均值/中值和第三子均值/中值判斷語音聲調。
本發明語音聲調的識別方法和裝置可以有效的對語音的聲調進行識別,識別速度快,識別精度高,從而有利于漢語語音的學習。
附圖說明
圖1為本發明語音聲調的識別方法的示意圖;
圖2為本發明語音聲調的識別方法中四個聲調的基音曲線;
圖3為本發明基于三段中值聲調識別時各個聲調的分布區域示意圖;
圖4為本發明語音聲調的識別裝置的示意圖。
具體實施方式
下面通過附圖和實施例,對本發明的技術方案做進一步的詳細描述。
本發明是一種利用基音的均值或中值來判斷語音聲調的方法,圖1為本發明語音聲調的識別方法的示意圖,如圖所示,本發明具體包括如下步驟:
步驟101,采集語音數據;
步驟102,對所述語音數據中的音節進行切分處理,根據預先建立好的語音模型,查找所述語音數據的音節單位,并切分出音節;
在聲調識別之前,進行音節切分,可以采用隱馬爾科夫模型(HMM)訓練聲學模型的方法,借助于預先建好的-語音模型,再利用Viterbi算法在預知語音內容的前提下找出語音信號的音節單位,把音節切分出來。
步驟103,將所述語音數據中的音節的基音序列進行分割,分別得到第一子基音序列、第二子基音序列和第三子基音序列;
步驟104,將所述第一子基音序列、第二子基音序列和第三子基音序列分別取均值/中值,得到第一子均值/中值、第二子均值/中值和第三子均值/中值;
步驟105,根據所述第一子均值/中值、第二子均值/中值和第三子均值/中值判斷語音聲調。
根據所述第一子均值、第二子均值和第三子均值判斷語音聲調具體為:如果所述第一子均值、第二子均值和第三子均值相近似則為陰平聲調;如果所述第一子均值、第二子均值和第三子均值為遞增則為陽平聲調;如果所述第一子均值和第三子均值均大于第二子均值則為上聲聲調;如果所述第一子均值,第二子均值和第三子均值為遞減則為去聲聲調。
圖2為本發明語音聲調的識別方法中四個聲調的基音曲線,如圖所示,四個聲調的基音曲線各有特點:陰平的基音曲線平直而高,陽平的基音曲線由低而高,上聲的基音曲線是一個凹形曲線,去聲的聲調曲線從高到低大幅下降。所以如果將各個聲調的基音曲線分成三段,各段求取基音平均值則有:陰平會具有三個相近的-均值,陽平有三個遞增的均值,上聲中段具有相比于頭尾兩段要小的均值,去聲則是三個遞減的均值。所以可以利用三段均值參數對聲調進行判別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京中傳天籟數字技術有限公司,未經北京中傳天籟數字技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210088946.9/2.html,轉載請聲明來源鉆瓜專利網。





