[發明專利]一種多模態發音數據采集方法與系統有效
| 申請號: | 202011423644.3 | 申請日: | 2020-12-08 |
| 公開(公告)號: | CN114615450B | 公開(公告)日: | 2023-02-17 |
| 發明(設計)人: | 劉娟;蘇榮鋒;王嵐;燕楠 | 申請(專利權)人: | 中國科學院深圳先進技術研究院 |
| 主分類號: | H04N5/76 | 分類號: | H04N5/76;G10L25/03;G10L25/51;G11B20/10;G06F9/48;A61B5/00 |
| 代理公司: | 北京市誠輝律師事務所 11430 | 代理人: | 范盈 |
| 地址: | 518055 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 多模態 發音 數據 采集 方法 系統 | ||
1.一種多模態發音數據采集方法,其特征在于包括以下步驟:
步驟1)、建立漢語發聲文本材料及任務,根據不同群體的語言癥狀及漢語發音特征設計包括音節、單字、詞語、句子和會話內容的發聲文本采集材料及任務;
步驟2)、采集多維度信息,被采集人員根據發聲文本采集材料發音時采用音頻采集設備、視頻采集設備和呼吸帶設備同步采集人員的語音、視頻和呼吸數據;
步驟3)、多維度信息采集結果的同步處理,數據采集結束后進行自動存儲命名,通過兩個線程的語音數據為導向實現呼吸信號與音視頻數據的精準同步;
步驟4)、發音特征提取及分析,對同步后的多維度信息進行聲學、運動、圖像特征參數的提取,對不同群體的發聲特性和言語癥狀進行深入計算和分析,得到采集人員的發音數據;
其中,步驟3)呼吸信號與音視頻數據的同步過程為:
(3.1)音頻與視頻同步啟動采集:采用音頻和視頻兩個線程進行錄制,在采集任務開始時,同步開啟兩個線程,只有在兩個線程都開啟時,開始數據的寫入;
(3.2)呼吸帶與音視頻同步啟動采集:呼吸帶采集設備同步多通道采集語音、胸腹呼吸信號,在確定音視頻數據同步啟動錄入的同時,保證呼吸帶采集設備的同步啟動,實現呼吸信號和音視頻信號在采集階段的同步寫入與錄制。
2.根據權利要求1所述的多模態發音數據采集方法,其特征在于:所述步驟1)建立漢語發聲文本材料及任務時,將音節、單字、詞語、句子和會話設置為不同任務模塊,每個任務模塊設置具有不同難易程度的等級,不同群體根據實際語言癥狀特征和身體狀態能夠選擇不同的任務模塊組合及不同難易程度,不同群體還能夠根據身體狀態及語言癥狀調整每個任務模塊的發音時間和休息時間。
3.根據權利要求2所述的多模態發音數據采集方法,其特征在于:所述任務模塊包括音節模塊,所述音節模塊包括元音、輔音、高頻音節、低頻音節和易混音節內容,呈現方式為漢字加音節,根據不同群體的身體狀態能夠調節每個音節的呈現時間和發音時間,發音后自動切換到下一個音節。
4.根據權利要求2所述的多模態發音數據采集方法,其特征在于:所述步驟2)采集多維度信息,數據采集得到的原始數據集包括3個目錄:視頻數據avi、語音數據wav、呼吸數據wav,每位參與者的每份數據一一對應,自動匹配命名。
5.根據權利要求2所述的多模態發音數據采集方法,其特征在于:所述步驟2)采集多維度信息時設置有自動化采集流程。
6.一種多模態發音數據采集系統,其特征在于包括:
漢語發聲文本材料及任務建立模塊,用于根據不同群體的語言癥狀及漢語發音特征設計包括音節、單字、詞語、句子和會話內容的發聲文本采集材料及任務;
多維度信息采集模塊,用于采集被采集人員根據發聲文本采集材料發音時的語音、視頻和呼吸數據;
多維度信息采集結果同步處理模塊,用于實現采集的語音、視頻和呼吸數據的精準同步;
所述多維度信息采集結果同步處理模塊還用于:
音頻與視頻同步啟動采集:采用音頻和視頻兩個線程進行錄制,在采集任務開始時,同步開啟兩個線程,只有在兩個線程都開啟時,開始數據的寫入;
呼吸帶與音視頻同步啟動采集:呼吸帶采集設備同步多通道采集語音、胸腹呼吸信號,在確定音視頻數據同步啟動錄入的同時,保證呼吸帶采集設備的同步啟動,實現呼吸信號和音視頻信號在采集階段的同步寫入與錄制;
發音特征提取及分析模塊,用于對同步后的多維度信息進行聲學、運動、圖像特征參數的提取,對不同群體的發聲特性和言語癥狀進行深入計算和分析,得到采集人員的發音數據。
7.根據權利要求6所述的多模態發音數據采集系統,其特征在于:所述多維度信息采集模塊采用包括呼吸設備、語音設備、視頻設備的多模態數據采集平臺。
8.根據權利要求7所述的多模態發音數據采集系統,其特征在于:所述呼吸設備為呼吸帶設備、語音設備為麥克風、視頻設備為攝像頭。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院深圳先進技術研究院,未經中國科學院深圳先進技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011423644.3/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





