[發(fā)明專利]一種語音分析的系統(tǒng)和方法在審
| 申請(qǐng)?zhí)枺?/td> | 202010106462.7 | 申請(qǐng)日: | 2020-02-21 |
| 公開(公告)號(hào): | CN111739556A | 公開(公告)日: | 2020-10-02 |
| 發(fā)明(設(shè)計(jì))人: | 屈華民;陳遠(yuǎn)哲;傅四維;袁林萍;伍翱宇 | 申請(qǐng)(專利權(quán))人: | 藍(lán)星球培訓(xùn) |
| 主分類號(hào): | G10L25/51 | 分類號(hào): | G10L25/51;G10L25/69;G06F16/64;G06F16/683;G10L19/02 |
| 代理公司: | 深圳尚業(yè)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44503 | 代理人: | 文蓉 |
| 地址: | 美國新澤西州蒙*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 語音 分析 系統(tǒng) 方法 | ||
1.一種處理音頻信號(hào)的計(jì)算機(jī)實(shí)現(xiàn)的方法,包括以下步驟:
從所述音頻信號(hào)中提取韻律特征;
利用源自所述音頻信號(hào)或與所述音頻信號(hào)相關(guān)聯(lián)的腳本將提取的韻律特征校準(zhǔn);以及
利用所述校準(zhǔn)的提取的韻律特征將所述腳本分割成第一類型的結(jié)構(gòu)塊。
2.根據(jù)權(quán)利要求1所述的方法,其中所述音頻信號(hào)包括人類語音的數(shù)字音頻剪輯或從文本生成的計(jì)算機(jī)合成語音的數(shù)字音頻剪輯。
3.根據(jù)權(quán)利要求1所述的方法,其中所述分割步驟將所述腳本和所述校準(zhǔn)的提取的韻律特征同時(shí)分割成第一類型的結(jié)構(gòu)塊,其中分割的所述腳本的第一類型的結(jié)構(gòu)塊包括構(gòu)成所述腳本的分句、短語或句子中的任意一個(gè)或任意組合。
4.根據(jù)權(quán)利要求1所述的方法,其中從所述音頻信號(hào)中提取所述韻律特征以形成具有預(yù)定義的、選擇的或計(jì)算的采樣率的時(shí)間序列。
5.根據(jù)權(quán)利要求4所述的方法,其中,在利用源自所述音頻信號(hào)或與所述音頻信號(hào)相關(guān)聯(lián)的腳本將提取的韻律特征校準(zhǔn)后,構(gòu)成所述腳本的每個(gè)第二類型的結(jié)構(gòu)塊被標(biāo)記以開始時(shí)間戳和結(jié)束時(shí)間戳中的一個(gè)或兩個(gè),其中,構(gòu)成所述腳本的第二類型的結(jié)構(gòu)塊包括一元字母組、二元字母組和三元字母組中的任意一個(gè)或任意組合。
6.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括以下步驟:
確定源自所述腳本的所述第一類型的結(jié)構(gòu)塊與所述第一類型的另一結(jié)構(gòu)塊之間的距離測(cè)度。
7.根據(jù)權(quán)利要求6所述的方法,其中所述距離測(cè)度包括源自所述腳本的所述第一類型的結(jié)構(gòu)塊與所述第一類型的另一結(jié)構(gòu)塊之間的相似性測(cè)度。
8.根據(jù)權(quán)利要求6所述的方法,進(jìn)一步包括以下步驟:
對(duì)于源自所述腳本的所述第一類型的結(jié)構(gòu)塊和所述第一類型的另一結(jié)構(gòu)塊中的每一個(gè),提取包括第二類型的結(jié)構(gòu)塊的每個(gè)所述第一類型的結(jié)構(gòu)塊的詞性(POS)標(biāo)簽,以形成POS序列;以及
計(jì)算源自所述腳本的所述第一類型的結(jié)構(gòu)塊的所述POS與所述第一類型的另一結(jié)構(gòu)塊的所述POS之間的編輯距離。
9.根據(jù)權(quán)利要求8所述的方法,其中使用Damerau-Levenshtein距離來計(jì)算源自所述腳本的所述第一類型的結(jié)構(gòu)塊的所述POS與所述第一類型的另一結(jié)構(gòu)塊的所述POS之間的所述編輯距離。
10.根據(jù)權(quán)利要求7所述的方法,其中源自所述腳本的所述第一類型的結(jié)構(gòu)塊與所述第一類型的另一結(jié)構(gòu)塊之間的所述相似性測(cè)度由下式確定:
其中CSS1和CSS2分別包括源自所述腳本的所述第一類型的結(jié)構(gòu)塊和所述第一類型的另一結(jié)構(gòu)塊,并且其中CSS(S1,S2)是計(jì)算出的相似性測(cè)度。
11.一種用于處理音頻信號(hào)的系統(tǒng),所述系統(tǒng)包括:
信號(hào)分析模塊,用于從所述音頻信號(hào)中提取韻律特征;
信號(hào)校準(zhǔn)模塊,用于利用源自所述音頻信號(hào)或與所述音頻信號(hào)相關(guān)聯(lián)的腳本將提取的韻律特征校準(zhǔn);以及
腳本分割模塊,用于利用提取的韻律特征將所述腳本分割成第一類型的結(jié)構(gòu)塊。
12.一種搜索語音數(shù)據(jù)集的計(jì)算機(jī)實(shí)現(xiàn)的方法,所述方法包括以下步驟:
從包括腳本的所述語音數(shù)據(jù)集的一部分接收包括第一類型的結(jié)構(gòu)塊的用戶輸入;
提取包括第二類型的結(jié)構(gòu)塊的每個(gè)輸入的所述第一類型的結(jié)構(gòu)塊的詞性(POS)標(biāo)簽,以形成輸入的所述第一類型的結(jié)構(gòu)塊的POS序列;以及
將輸入的所述第一類型的結(jié)構(gòu)塊的所述提取的POS序列與所述語音數(shù)據(jù)集中的所述第一類型的結(jié)構(gòu)塊的POS序列進(jìn)行比較,從而識(shí)別所述語音數(shù)據(jù)集中具有與輸入的所述第一類型的結(jié)構(gòu)塊相同或相似的POS的一個(gè)或多個(gè)所述第一類型的其他結(jié)構(gòu)塊。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于藍(lán)星球培訓(xùn),未經(jīng)藍(lán)星球培訓(xùn)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010106462.7/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





