[發明專利]一種評測言語狀態的方法及裝置在審
| 申請號: | 201810575498.2 | 申請日: | 2018-06-06 |
| 公開(公告)號: | CN108877836A | 公開(公告)日: | 2018-11-23 |
| 發明(設計)人: | 姜涵予 | 申請(專利權)人: | 姜涵予 |
| 主分類號: | G10L25/48 | 分類號: | G10L25/48;G10L25/51;G06K9/00;G06K9/62 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 逯恒 |
| 地址: | 300450 *** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 評測 用戶基礎信息 評測結果 指令 發音障礙 言語障礙 用戶輸出 用戶響應 語言障礙 感受性 性語言 口吃 響應 申請 判定 身高 采集 發育 檢測 分析 | ||
1.一種評測言語狀態的方法,其特征在于,包括:
獲取言語評測方案;
基于所述言語評測方案,向用戶輸出引導指令,并采集用戶響應引導指令所作出的響應行為;言語評測方案是根據用戶基礎信息確定的,所述用戶基礎信息包括以下的至少兩個:年齡、性別、身高和體重;
根據用戶的響應行為,確定用戶的評測結果;所述評測結果包括以下至少一個結果:感受性語言障礙、模仿言語障礙、口語退化、構音障礙、發音障礙、口吃。
2.根據權利要求1所述的一種評測言語狀態的方法,其特征在于:
所述言語評測方案包括評測言語場景方案和評測言語采集方案;
評測言語場景方案包括場景參與形式、場景主題和場景道具;所述場景參與形式包括陪同或獨立參與;所述場景主題包括以下至少一個主題:語音語調檢測、語義識別;
評測言語采集方案包括以下任意一個或多個:視頻采集、音頻采集和傳感器信號采集;
或,評測言語采集方案包括以下一個或多個:肢體動作采集、語音語調采集和面部表情采集。
3.根據權利要求1所述的一種評測言語狀態的方法,其特征在于:
根據用戶的響應行為,確定用戶的評測結果包括:
通過視頻采集設備生成用戶行為視頻;
根據用戶行為視頻中圖片與參考圖片的相似度確定用戶的肢體動作軌跡和面部表情變化情況;
所述參考圖片是預先存儲在處理器中的;
根據用戶的肢體動作軌跡和面部表情變化情況確定用戶的評測結果;
根據用戶的響應行為,確定用戶的評測結果包括:
通過音頻采集設備生成用戶行為音頻;
根據用戶行為音頻中的音頻信號頻譜與參考音頻信號頻譜的相似度確定用戶的語音語調變化情況;
所述參考音頻信號是預先存儲在處理器中的;
根據用戶的語音語調變化情況確定用戶的評測結果。
4.根據權利要求1所述的一種評測言語狀態的方法,其特征在于:
根據用戶的響應行為,確定用戶的評測結果包括:
通過不同角度的攝像頭獲取用戶的響應行為,以生成多個用戶行為視頻;
將多個用戶行為視頻轉換為靜態圖片組;
將靜態圖片組壓縮,得到第一圖片組;
將壓縮后的圖片灰度化,得到第二圖片組;
對比第二圖片組中的每一幀圖片與每一幀參考圖片的灰度等級,得到兩幅圖片灰度等級不同的像素點數目;
計算第二圖片組中的每一幀圖片總體灰度差異平均數,所述總體灰度差異平均數為第二圖片組中每張圖片的灰度差異平均數的總和除以第二圖片組中圖片的總數;所述灰度差異平均數為灰度等級不同的像素點數目的總和除以參考圖片數量的結果;
根據設定的相似度等級劃分規則,獲取總體灰度差異平均數所對應的圖片相似度;
根據圖片相似度確定用戶的肢體動作軌跡和面部表情變化情況;
根據用戶的肢體動作軌跡和面部表情變化情況確定用戶的評測結果;
根據用戶的響應行為,確定用戶的評測結果還包括:
通過不同角度的音頻采集設備獲取用戶的響應行為,以生成多個用戶音頻信號;
對采集到的用戶音頻信號提取音頻信號頻譜;
識別音頻信號頻譜的波峰位置;
獲取各波峰位置對應的特征值和時間點,根據各特征值和時間點得到用戶音頻信號的第一時間序列;
對比第一時間序列與第二時間序列,根據對比結果得到用戶音頻信號與參考音頻信號的相似度;所述第二時間序列為參考音頻信號的時間序列;
根據音頻信號相似度確定用戶的語音語調變化情況;
根據用戶的語音語調變化情況確定用戶的評測結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于姜涵予,未經姜涵予許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810575498.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:評價語音信號的方法及系統
- 下一篇:音頻信號異常識別方法、裝置和存儲介質





