[發明專利]無聲唇語識別方法及系統有效
| 申請號: | 202010016710.9 | 申請日: | 2020-01-08 |
| 公開(公告)號: | CN111091831B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 顧昌展;溫力 | 申請(專利權)人: | 上海交通大學 |
| 主分類號: | G10L15/25 | 分類號: | G10L15/25 |
| 代理公司: | 上海交達專利事務所 31201 | 代理人: | 王毓理;王錫麟 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 無聲 識別 方法 系統 | ||
1.一種無聲唇語識別方法,其特征在于,通過連續發出作為載波的毫米波信號并聚焦于用戶口腔區域,通過用戶說話行為在相位上對毫米波信號進行調制并部分反射,通過對反射信號轉換至基帶并校正后采用基于三角變換的語音相位模糊線性重構,得到用戶說話行為信息;
所述的載波為調頻連續波;
所述的載波為鋸齒波Xc(t)=A?cos[2πfct+φ(t)],其中:A為振幅,fc為載波頻率,為發射器的相位噪聲;
所述的反射信號,經轉換至基帶后得到:其中:AI和AQ為I與Q信號的振幅,θ為恒定相移,為殘余的相位噪聲,λ為載波波長,DCI和DCQ為I與Q信號中的直流偏移量;
所述的校正后的信號為:
所述的基于三角變換的語音相位模糊線性重構是指:依次對校正信號和信號進行微分后再進行積分,從而得到位移信息,具體時域表達式及其離散形式為:在得到無聲唇語運動的位移信息后,進一步利用機器學習中的特征提取方法得到多維特征向量,或者使用深度學習中的卷積神經網絡識別不同唇語的特征。
2.一種權利要求1所述方法的無聲唇語識別系統,其特征在于,包括:供電單元、雷達收發機、載波發生單元和中頻放大單元,其中:供電單元與其他各單元相連并提供工作電壓,雷達收發機輸入端可通過開關自主選擇與載波發生單元相連或與固定的參考電壓相連,雷達收發機輸出端與中頻放大單元相連并傳輸I/Q信號,中頻放大單元與信號輸出端相連并傳輸放大后的I/Q信號。
3.根據權利要求2所述的系統,其特征是,所述的雷達收發機包括:功率放大器、低噪聲放大器、正交混頻器、多相濾波器、壓控振蕩器、封裝收發天線和本地振蕩器,其中:功率放大器分別與本地振蕩器和發送天線相連并傳送發送信號,低噪聲放大器的輸入端與接收天線相連并傳輸接收信號,正交混頻器與低噪聲放大器相連并傳輸轉換至基帶的接收信號,多相濾波器與壓控振蕩器相連,壓控振蕩器分別與輸入電壓和本地振蕩器相連。
4.根據權利要求2所述的系統,其特征是,所述的載波發生單元是以三角波發生電路為基礎設計的自激振蕩電路,利用二極管的單向導電性實現不同的積分路徑,該電路包括:同相輸入的滯回比較器和積分運算電路,其中:當前向積分的時間常數遠大于后向積分的時間常數時,上升沿的斜率與下降沿的斜率差別很大,從而將三角波轉化為鋸齒波。
5.根據權利要求4所述的系統,其特征是,所述的自激振蕩電路中進一步設有微調電位器用于控制鋸齒波的振幅和周期,以實現在參考電壓附近的可調掃描。
6.根據權利要求2所述的系統,其特征是,進一步設有與雷達收發機相連的用于提高射頻混頻器輸出的信噪比水平的中頻放大器。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海交通大學,未經上海交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010016710.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種正負脈沖式蓄電池快充發電機
- 下一篇:一種支撐相控制膝關節支具





