[發(fā)明專利]基于重音突現(xiàn)度的英語發(fā)音質(zhì)量評價(jià)方法有效
| 申請?zhí)枺?/td> | 202011213272.1 | 申請日: | 2020-11-04 |
| 公開(公告)號: | CN112466335B | 公開(公告)日: | 2023-09-29 |
| 發(fā)明(設(shè)計(jì))人: | 艾群 | 申請(專利權(quán))人: | 吉林體育學(xué)院 |
| 主分類號: | G10L25/60 | 分類號: | G10L25/60;G10L15/00 |
| 代理公司: | 上海旭新專利代理事務(wù)所(普通合伙) 31474 | 代理人: | 毛碧娟 |
| 地址: | 130000 吉林*** | 國省代碼: | 吉林;22 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 重音 突現(xiàn) 英語 發(fā)音 質(zhì)量 評價(jià) 方法 | ||
本發(fā)明提出基于重音突現(xiàn)度的英語發(fā)音質(zhì)量評價(jià)方法,所述方法包括如下步驟:S1:通過第一拾音陣列接收第一語音輸入,所述第一語音輸入包含至少一個(gè)英文序列;S2:通過第二預(yù)處理模塊對所述第一語音輸入進(jìn)行預(yù)處理,得到預(yù)處理語音序列,所述預(yù)處理語音序列包括多個(gè)存在重疊區(qū)間的子序列;S3:基于所述多個(gè)子序列的分布特征,對所述第一語音輸入序列進(jìn)行發(fā)音質(zhì)量評價(jià)。所述預(yù)處理包括預(yù)加重、分幀以及端點(diǎn)檢測等步驟。本發(fā)明還公開了執(zhí)行所述方法的計(jì)算機(jī)可讀存儲介質(zhì)。本發(fā)明的技術(shù)方案能夠在發(fā)音質(zhì)量評價(jià)中避免人為主觀因素的影響,從語音輸入本身的重音韻律的音頻特征進(jìn)行質(zhì)量評價(jià),并且還能自適應(yīng)的調(diào)節(jié)預(yù)處理參數(shù)。
技術(shù)領(lǐng)域
本發(fā)明屬于語音識別與評價(jià)技術(shù)領(lǐng)域,?尤其涉及一種基于重音突現(xiàn)度的英語發(fā)音質(zhì)量評價(jià)方法及實(shí)現(xiàn)該方法的計(jì)算機(jī)可讀存儲介質(zhì)。
背景技術(shù)
語音評測是利用計(jì)算機(jī)對測評者發(fā)音的語音信號進(jìn)行分析,并客觀地評價(jià)其語言的發(fā)音規(guī)范程度。它主要應(yīng)用于語音朗讀訓(xùn)練中的跟讀語音與參考語音接近程度的自動評測,同時(shí)也應(yīng)用于語音朗讀測試中音節(jié)發(fā)音的自動評分。
發(fā)音質(zhì)量客觀評價(jià)可以分為兩個(gè)方面,一個(gè)方面是從語音信號學(xué)角度進(jìn)行評價(jià),主要考察音素或單詞的發(fā)音是否準(zhǔn)確;另一個(gè)方面是從音韻學(xué)角度進(jìn)行評價(jià),主要從韻律方面進(jìn)行考察,包括重音、語調(diào)、語速、停頓等。其中,重音的特征主要表現(xiàn)為音高的提高,音節(jié)段長的延長和音強(qiáng)的增大等,也就是對應(yīng)基頻、段長和能量這三個(gè)語音信號基本參數(shù)。
當(dāng)前對計(jì)算機(jī)輔助語言學(xué)習(xí)系統(tǒng)進(jìn)行研究的機(jī)構(gòu)主要有SRI語音,他們主要關(guān)注測試語音與標(biāo)準(zhǔn)發(fā)音者整體發(fā)音水平的相似度情況。他們從幾個(gè)角度例如音素的后驗(yàn)概率,段時(shí)長和語音時(shí)間打分作為評測的依據(jù),利用機(jī)器打分和人工打分的相關(guān)度來評估系統(tǒng)的有效性。此外,荷蘭奈梅亨大學(xué)提出的VICK系統(tǒng)主要研究了人工打分的合理性,尤其是語音中詞的切割,韻律結(jié)構(gòu),流暢性對人工打分的影響。
在口語評估方面,現(xiàn)在國外已經(jīng)有很多的產(chǎn)品。其中著名的是Ordinate公司的Versant系統(tǒng),它可以從語句的簡答、復(fù)述,文章的朗讀、造句和內(nèi)容的概括等幾個(gè)方面對說話人進(jìn)行語言能力的評估。此外,法國的歐佳龍?jiān)谏虡I(yè)語言學(xué)習(xí)中成功地利用了語音識別的技術(shù),他們的重量級軟件產(chǎn)品“TELL?Me?More”廣泛用于語言學(xué)習(xí),它能自動檢測語音中的錯(cuò)誤發(fā)音,并從聲調(diào)和詞級的發(fā)音兩個(gè)方面對語音進(jìn)行打分。
在專利技術(shù)方面,中國發(fā)明專利申請CN202010811978.1提出一種語音測評方法、裝置、設(shè)備及計(jì)算機(jī)存儲介質(zhì),包括:獲取根據(jù)目標(biāo)文本輸入的待測評語音;按照目標(biāo)文本中的各目標(biāo)音素在目標(biāo)文本中的發(fā)音順序,確定各目標(biāo)音素在待測評語音中的待測評發(fā)音時(shí)間;根據(jù)各目標(biāo)音素在待測評語音中的待測評發(fā)音時(shí)間和各目標(biāo)音素的標(biāo)準(zhǔn)發(fā)音時(shí)間的匹配程度,確定待測評語音的測評結(jié)果;標(biāo)準(zhǔn)發(fā)音時(shí)間是根據(jù)各目標(biāo)元素在目標(biāo)文本的標(biāo)準(zhǔn)語音中的發(fā)音時(shí)間確定的。該方法中根據(jù)各目標(biāo)元素的待測評發(fā)音時(shí)間和標(biāo)準(zhǔn)發(fā)音時(shí)間的匹配程度確定待測評語音的測評結(jié)果,能夠提高確定待測評語音中發(fā)音不標(biāo)準(zhǔn)的目標(biāo)音素的準(zhǔn)確度,進(jìn)而提升語音測評的準(zhǔn)確度。
中國發(fā)明專利申請第200510114848.8號公開了一種基于HMM的發(fā)音質(zhì)量評價(jià)方法,該方法主要依靠聲學(xué)模型,只是從音素發(fā)音是否準(zhǔn)確來評價(jià)發(fā)音質(zhì)量。中國發(fā)明專利申請第200810102076.X號提出了一種以教師的發(fā)音作為參考語音的評價(jià)方法,該方法從聲學(xué)、感知、和韻律方面計(jì)算學(xué)習(xí)者的測試語音相對于參考語音的發(fā)音質(zhì)量差別,但是在韻律上只是使用基頻和段長,但由于基頻和段長只是韻律的低層次參數(shù),還不能很好的反映韻律特性。
基于上述問題,授權(quán)專利CN101996635B提出基于重音突顯度的英語發(fā)音質(zhì)量評價(jià)方法,屬于語音信號技術(shù)領(lǐng)域,其特征包括:計(jì)算音節(jié)歸一化段長,計(jì)算音節(jié)最高歸一化響度,計(jì)算音節(jié)最高歸一化半音程;利用突顯度模型,計(jì)算音節(jié)段長突顯度、音節(jié)響度突顯度和音節(jié)半音程突顯度;利用Bayes分類器計(jì)算音節(jié)歸一化重音突顯度;計(jì)算重音突顯度分?jǐn)?shù),并對分?jǐn)?shù)進(jìn)行映射。該發(fā)明發(fā)音質(zhì)量評價(jià)方法穩(wěn)健性好,能與匹配分?jǐn)?shù)結(jié)合使用,以進(jìn)一步提高其與專家評分的相關(guān)性,可以用于交互式的語言學(xué)習(xí)系統(tǒng)和自動口語評測系統(tǒng)中。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于吉林體育學(xué)院,未經(jīng)吉林體育學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011213272.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





