[發明專利]無聲唇語識別方法及系統有效
| 申請號: | 202010016710.9 | 申請日: | 2020-01-08 |
| 公開(公告)號: | CN111091831B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 顧昌展;溫力 | 申請(專利權)人: | 上海交通大學 |
| 主分類號: | G10L15/25 | 分類號: | G10L15/25 |
| 代理公司: | 上海交達專利事務所 31201 | 代理人: | 王毓理;王錫麟 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 無聲 識別 方法 系統 | ||
一種無聲唇語識別方法及系統,通過連續發出作為載波的毫米波信號并聚焦于用戶口腔區域,通過用戶說話行為在相位上對毫米波信號進行調制并部分反射,通過對反射信號轉換至基帶并校正后采用基于三角變換的語音相位模糊線性重構,得到用戶說話行為信息。本發明具有無需接觸、穿透性強、精度高等優點;能夠精確追蹤唇部的精細位移運動,很好地檢測出準確的語音命令。
技術領域
本發明涉及的是一種信息安全領域的技術,具體是一種基于小型120GHz干涉雷達系統的無聲唇語識別方法及系統。
背景技術
隨著與計算機設備的交互變得越來越普遍,交互的趨勢是變得更自然和更智能。人們因此開發了各種各樣的自然用戶交互界面,如觸摸屏、注視跟蹤、手勢識別和語音識別系統,其中語音識別尤受關注,因為它與人們在日常生活中發出命令的方式相似。然而,在一些場合下人們并不方便去使用語音識別,例如應該保持安靜的場合,或者希望在公共場合隱私能得到保護的情況。另外,一些人可能會因為疾病而失去發聲的能力,他們對語言交流的需求也應該得到重視。因此,無聲唇語感知的概念出現了。目前人們也研究了幾種進行無聲唇語感知的方法。
發明內容
本發明提出一種基于毫米波雷達干涉相位的無聲唇語識別方法及系統,并針對現有技術毫米波非線性相位調制中的相位模糊問題,提出一種無聲唇語識別方法及系統,具有無需接觸、穿透性強、精度高等優點;能夠精確追蹤唇部的精細位移運動,很好地檢測出準確的語音命令。
本發明是通過以下技術方案實現的:
本發明涉及一種無聲唇語識別方法,通過連續發出作為載波的毫米波信號并聚焦于用戶口腔區域,通過用戶說話行為在相位上對毫米波信號進行調制并部分反射,通過對反射信號轉換至基帶并校正后采用基于三角變換的語音相位模糊線性重構,得到用戶說話行為信息。
本發明涉及一種無聲唇語識別系統,包括:供電單元、雷達收發機、載波發生單元和中頻放大單元,其中:供電單元與其他各單元相連并提供工作電壓,雷達收發機輸入端可通過開關自主選擇與載波發生單元相連或與固定的參考電壓相連,雷達收發機輸出端與中頻放大單元相連并傳輸I/Q信號,中頻放大單元與信號輸出端相連并傳輸放大后的I/Q信號。
所述的載波為調頻連續波,優選為鋸齒波。
技術效果
本發明整體解決了通過毫米波雷達干涉相位的測量方法獲得唇部多普勒相位模糊問題。
與現有技術相比,本發明能夠利用毫米波雷達干涉相位的方法來測量唇部運動引起的多普勒相移,采用120GHz毫米波感知唇語,并定制了包括射頻前端、中頻、電源管理、信號發射等在內的全集成120GHz毫米波雷達小型化系統,輔以基于相干雷達的相位線性重構算法實現微小嘴唇運動的信號重構。
附圖說明
圖1為本發明基于短距毫米波雷達傳感的無聲唇語識別方法示意圖;
圖2為本發明雷達傳感器系統示意圖;
圖3為實施例中兩種不同脈沖重復時間和振幅的鋸齒信號示意圖;
圖4為實施例中頻放大器輸出的命令短語“Cancel”和“Up”的I/Q信號、I/Q信號歸一化頻譜圖
圖5為實施例中八個命令短語的I/Q信號及位移波形示意圖;
圖中:(a)“Delete”;(b)“Left”;(c)“Off”;(d)“Yes”;(e)“Go”;(f)“Next”;(g)“Stop”;(h)“Play”.
圖6為實施例中三個命令句子的I/Q信號及位移波形示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海交通大學,未經上海交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010016710.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種正負脈沖式蓄電池快充發電機
- 下一篇:一種支撐相控制膝關節支具





