[發明專利]感冒檢測系統、設備、車輛和存儲介質在審
| 申請號: | 202211216057.6 | 申請日: | 2022-09-30 |
| 公開(公告)號: | CN115527553A | 公開(公告)日: | 2022-12-27 |
| 發明(設計)人: | 徐培來 | 申請(專利權)人: | 北京賓理信息科技有限公司 |
| 主分類號: | G10L25/66 | 分類號: | G10L25/66;G10L25/30;G16H40/67;G16H50/20 |
| 代理公司: | 北京市漢坤律師事務所 11602 | 代理人: | 魏小薇;吳麗麗 |
| 地址: | 100020 北京市朝陽*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 感冒 檢測 系統 設備 車輛 存儲 介質 | ||
1.一種感冒檢測系統,包括:
語音獲取模塊,用于獲取至少一個發音單元的各語音片段,其中,對于所述至少一個發音單元中的每個發音單元,所述各語音片段包括該發音單元的至少一個語音片段,每個發音單元的所述至少一個語音片段包括受檢者的聲學特征;
特征拼接模塊,用于將所述至少一個發音單元的各語音片段分別與所述至少一個發音單元的相應參考語音片段進行拼接,得到所述至少一個發音單元的一個或多個拼接特征向量,其中,每個發音單元對應所述一個或多個拼接特征向量中的至少一個拼接特征向量,每個發音單元的參考語音片段包括所述受檢者在非鼻塞狀態下的聲學特征;
概率向量模塊,用于將所述一個或多個拼接特征向量輸入至少一個第一深度神經網絡模型中的對應第一深度神經網絡模型,得到所述至少一個第一深度神經網絡模型輸出的一個或多個鼻塞概率向量,所述一個或多個鼻塞概率向量分別對應所述一個或多個拼接特征向量,其中,所述至少一個第一深度神經網絡模型分別針對所述至少一個發音單元被預先訓練,所述一個或多個鼻塞概率向量中的每個鼻塞概率向量表征所述至少一個發音單元的各語音片段中的相應語音片段包括所述受檢者在鼻塞狀態下的聲學特征的概率;以及
結果檢測模塊,用于利用第二深度神經網絡模型處理所述一個或多個鼻塞概率向量,得到所述第二深度神經網絡模型輸出的所述受檢者的感冒檢測結果。
2.根據權利要求1所述的系統,其中,所述至少一個發音單元中的每個發音單元包括音素,并且其中,所述獲取至少一個發音單元的各語音片段,包括:
獲取所述受檢者的語音音頻流;
將所述語音音頻流輸入語音識別模型,得到所述語音識別模型輸出的包括多個音素的語音片段序列;以及
將所述語音片段序列中對應于相應至少一個目標音素的語音片段作為所述至少一個發音單元的各語音片段。
3.根據權利要求2所述的系統,其中,所述至少一個發音單元的各語音片段包括對應于同一目標音素的多個語音片段,使得所述至少一個第一深度神經網絡模型中的對應第一深度神經網絡模型輸出與所述多個語音片段分別對應的多個鼻塞概率向量,并且其中,所述利用第二深度神經網絡模型處理所述一個或多個鼻塞概率向量,包括:
計算所述多個鼻塞概率向量的均值向量;以及
將所述均值向量輸入所述第二深度神經網絡模型。
4.根據權利要求1所述的系統,其中,所述將所述至少一個發音單元的各語音片段分別與所述至少一個發音單元的相應參考語音片段進行拼接包括:
將所述至少一個發音單元的各語音片段轉換成相應的第一頻域表示;
將所述至少一個發音單元的各參考語音片段轉換成相應的第二頻域表示;以及
將所述第一頻域表示中的每個第一頻域表示與所述第二頻域表示中的對應第二頻域表示進行拼接,得到所述至少一個發音單元的所述一個或多個拼接特征向量,其中,該對應第二頻域表示與該第一頻域表示對應于同一發音單元。
5.根據權利要求4所述的系統,還包括:
語速調整模塊,用于調整所述至少一個發音單元的各語音片段的音頻采樣率以供所述特征拼接模塊進行拼接,其中,經調整后的所述至少一個發音單元的各語音片段與所述至少一個發音單元的各參考語音片段中的對應參考語音片段具有相同的時長。
6.根據權利要求1-5中任一項所述的系統,其中,所述至少一個第一深度神經網絡模型中的每個第一深度神經網絡模型包括二分類深度神經網絡模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京賓理信息科技有限公司,未經北京賓理信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211216057.6/1.html,轉載請聲明來源鉆瓜專利網。





