[發(fā)明專利]發(fā)音測(cè)評(píng)方法、裝置、系統(tǒng)、介質(zhì)和計(jì)算設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 201910408727.6 | 申請(qǐng)日: | 2019-05-16 |
| 公開(公告)號(hào): | CN111951828A | 公開(公告)日: | 2020-11-17 |
| 發(fā)明(設(shè)計(jì))人: | 胡太;孫懌;沈欣堯;劉晨晨;崔守首;余津銳 | 申請(qǐng)(專利權(quán))人: | 上海流利說信息技術(shù)有限公司 |
| 主分類號(hào): | G10L25/51 | 分類號(hào): | G10L25/51;G10L25/57;G10L15/02;G10L15/25 |
| 代理公司: | 北京信遠(yuǎn)達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 11304 | 代理人: | 魏曉波 |
| 地址: | 200092 上海市楊浦區(qū)16*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 發(fā)音 測(cè)評(píng) 方法 裝置 系統(tǒng) 介質(zhì) 計(jì)算 設(shè)備 | ||
本發(fā)明的實(shí)施方式提供了一種發(fā)音測(cè)評(píng)方法。該方法包括:獲取用戶的發(fā)音視頻;從所述發(fā)音視頻中獲取有效視頻段;基于所述有效視頻段,獲取用戶的發(fā)音口型特征序列;根據(jù)用戶的發(fā)音口型特征序列與標(biāo)準(zhǔn)音口型特征序列按照預(yù)設(shè)計(jì)算方式得到發(fā)音口型分?jǐn)?shù)。本方法通過用戶發(fā)音時(shí)的圖像特征來評(píng)判用戶的發(fā)音是否準(zhǔn)確,而不是根據(jù)用戶發(fā)音的語音特征,避免了噪聲對(duì)語音識(shí)別的干擾,有效彌補(bǔ)語音識(shí)別在特定場(chǎng)景和任務(wù)下的不足,為用戶帶來了更好的體驗(yàn)。此外,本發(fā)明的實(shí)施方式還提供了一種發(fā)音測(cè)評(píng)裝置、系統(tǒng)、介質(zhì)和計(jì)算設(shè)備。
技術(shù)領(lǐng)域
本發(fā)明的實(shí)施方式涉及口語評(píng)測(cè)領(lǐng)域,更具體地,本發(fā)明的實(shí)施方式涉及一種發(fā)音測(cè)評(píng)方法、裝置、系統(tǒng)、介質(zhì)和計(jì)算設(shè)備。
背景技術(shù)
本部分旨在為權(quán)利要求書中陳述的本發(fā)明的實(shí)施方式提供背景或上下文。此處的描述不因?yàn)榘ㄔ诒静糠种芯统姓J(rèn)是現(xiàn)有技術(shù)。
現(xiàn)有的發(fā)音打分技術(shù)多數(shù)都是基于語音識(shí)別的方法,這些方法利用語音特征來判別音標(biāo)發(fā)音的準(zhǔn)確性。早期主流的打分技術(shù)主要是基于隱馬爾科夫模型的語音識(shí)別引擎,利用其似然分?jǐn)?shù)值(likelihoodscore)以及其他相關(guān)的信息做為評(píng)分依據(jù)。其中,最經(jīng)典的GOP(GoodnessofPronunciation)方法是由麻省理工大學(xué)的SilkeWitt在他的博士論文中提出。之后的評(píng)分方法大都與GOP算法相似,或者是由它衍生出來。
在某些場(chǎng)景下,如環(huán)境嘈雜或用戶發(fā)出的聲音較小,僅僅利用基于語音的方法較難準(zhǔn)確地判別用戶發(fā)音是否正確。
發(fā)明內(nèi)容
為此,非常需要一種改進(jìn)的發(fā)音測(cè)評(píng)方法,使得即使用戶處于嘈雜環(huán)境等場(chǎng)景下,依然能夠準(zhǔn)確地判別用戶發(fā)音是否正確。
在本上下文中,本發(fā)明的實(shí)施方式期望提供一種發(fā)音測(cè)評(píng)方法、裝置、介質(zhì)和計(jì)算設(shè)備。
在本發(fā)明實(shí)施方式的第一方面中,提供了一種發(fā)音測(cè)評(píng)方法,包括:
獲取用戶的發(fā)音視頻;
從所述發(fā)音視頻中獲取有效視頻段;
基于所述有效視頻段,獲取用戶的發(fā)音口型特征序列;
根據(jù)用戶的發(fā)音口型特征序列與標(biāo)準(zhǔn)音口型特征序列按照預(yù)設(shè)計(jì)算方式得到發(fā)音口型分?jǐn)?shù)。
在本發(fā)明的一個(gè)實(shí)施例中,從所述發(fā)音視頻中獲取有效視頻段,包括:
獲取所述用戶的發(fā)音視頻的視頻信號(hào);
基于所述視頻信號(hào)的波動(dòng),對(duì)所述發(fā)音視頻進(jìn)行裁剪,去除用戶未發(fā)音的視頻幀,以獲取有效視頻段。
在本發(fā)明的另一實(shí)施例中,采用基于z-score閾值匹配的方法對(duì)所述發(fā)音視頻進(jìn)行裁剪。
在本發(fā)明的又一個(gè)實(shí)施例中,基于所述有效視頻段,獲取用戶的發(fā)音口型特征序列,包括:
獲取所述有效視頻段中每一幀圖像的發(fā)音口型特征;
基于每一幀圖像的發(fā)音口型特征生成所述有效視頻段的發(fā)音口型特征序列。
在本發(fā)明的再一個(gè)實(shí)施例中,獲取所述有效視頻段中每一幀圖像的發(fā)音口型特征,包括:
基于每一幀圖像中嘴部區(qū)域的各個(gè)關(guān)鍵點(diǎn)到中心點(diǎn)的距離確定每一幀圖像的發(fā)音口型特征。
在本發(fā)明的再一個(gè)實(shí)施例中,所述中心點(diǎn)基于嘴型內(nèi)輪廓最高頂點(diǎn)與最低頂點(diǎn)以及最左頂點(diǎn)與最右頂點(diǎn)確認(rèn)。
在本發(fā)明的再一個(gè)實(shí)施例中,根據(jù)用戶的發(fā)音口型特征序列與標(biāo)準(zhǔn)音口型特征序列按照預(yù)設(shè)計(jì)算方式得到發(fā)音口型分?jǐn)?shù),包括:
將用戶的發(fā)音口型特征序列與標(biāo)準(zhǔn)音口型特征序列對(duì)比,獲得用戶的發(fā)音口型特征序列與標(biāo)準(zhǔn)音口型特征序列的發(fā)音口型特征相似度;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海流利說信息技術(shù)有限公司,未經(jīng)上海流利說信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910408727.6/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 互動(dòng)式矯正發(fā)音的裝置與方法
- 可視化發(fā)音教學(xué)方法及裝置
- 一種英語發(fā)音質(zhì)量評(píng)價(jià)系統(tǒng)
- 發(fā)音詞典生成方法及裝置、存儲(chǔ)介質(zhì)、電子設(shè)備
- 一種基于機(jī)器學(xué)習(xí)的口語發(fā)音檢錯(cuò)與糾正系統(tǒng)
- 一種發(fā)音教學(xué)方法、裝置、系統(tǒng)、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 發(fā)音訓(xùn)練與教學(xué)系統(tǒng)
- 一種基于音頻指紋的發(fā)音評(píng)測(cè)方法及終端
- 一種音質(zhì)美發(fā)音準(zhǔn)的漸變型發(fā)音孔嗩吶
- 音源裝置
- 一種自動(dòng)化云平臺(tái)易用性測(cè)評(píng)方法及系統(tǒng)
- 一種基于家庭服務(wù)業(yè)的誠(chéng)信體系評(píng)價(jià)方法
- 一種等保測(cè)評(píng)的自動(dòng)測(cè)評(píng)方法及系統(tǒng)
- 測(cè)評(píng)文檔生成方法、系統(tǒng)及終端設(shè)備
- 用于人才測(cè)評(píng)的多工具數(shù)字化評(píng)分方法和裝置
- 一種測(cè)評(píng)方法及系統(tǒng)
- 一種測(cè)評(píng)任務(wù)執(zhí)行信息的記錄方法及組件
- 一種基于云服務(wù)的安全測(cè)評(píng)方法及裝置
- 音視頻質(zhì)量測(cè)評(píng)系統(tǒng)、方法、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種創(chuàng)新創(chuàng)業(yè)綜合能力測(cè)評(píng)系統(tǒng)
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





