[發明專利]融合用戶多源發聲特征的身份認證方法、存儲介質及設備有效
| 申請號: | 202010790392.1 | 申請日: | 2020-08-07 |
| 公開(公告)號: | CN112116742B | 公開(公告)日: | 2021-07-13 |
| 發明(設計)人: | 趙衰;李鎮江;丁菡;惠維;王鴿;趙季中 | 申請(專利權)人: | 西安交通大學 |
| 主分類號: | G10L17/00 | 分類號: | G10L17/00 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 高博 |
| 地址: | 710049 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 融合 用戶 發聲 特征 身份 認證 方法 存儲 介質 設備 | ||
1.一種融合用戶多源發聲特征的身份認證方法,其特征在于,包括以下步驟:
S1、確定感知末端的尺寸,選擇RFID標簽數量和型號,構建感知末端,利用RFID射頻信號物理層信息,在用戶發出語音命令或認證口令過程中感知用戶嘴部運動;在每個標簽每次被成功讀取時獲得一次信號物理層信息,即感知信息;
S2、設計收發保護機制,在RFID讀寫器與感知末端的標簽通信過程中,在信號發射時加入動態隨機噪音,在接收信號時消除噪音并恢復標簽EPC,判斷感知信號真偽,根據RFID通信協議,讀寫器采取輪詢的方式與標簽進行通信,即每個通信周期內所有標簽被詢問一次且最多一次,每個標簽被詢問一次的通信過程包含Query、RN16、ACK和EPC,Query和ACK為讀寫器發出的命令,RN16和EPC是標簽的回復信號,在讀寫器發出ACK命令后,生成動態隨機噪音形式的連續載波,標簽將自身EPC調制到載波上并反向散射給讀寫器,實現動態隨機噪音的加載,在讀寫器每個輪詢周期的第一個問詢時隙,通過編程設置為空的問詢時隙,不允許標簽回復EPC信號,僅用于收發隨機噪音,估計短時信道狀態H用于同一個輪詢周期內所有標簽回復EPC段的噪音消除,收發保護機制具體為:在發射端加載動態隨機噪音保護通信內容,在接收端消除噪音恢復通信內容,動態隨機噪音僅收發雙發已知且不斷發生變化;
S3、識別用戶語音命令,若包含關鍵詞,根據步驟S2能否正確恢復感知末端標簽EPC確定進入步驟S4或拒接請求并結束,用戶或系統預先設置高風險關鍵詞,當用戶發起語音命令或認證口令時,先利用現有語音識別技術識別語音內容,若語音內容中不包含預設的高風險關鍵詞,不詢問收發保護機制,不進行用戶認證,直接執行命令相應的操作;當語音內容中包含預設的高風險關鍵詞時,啟動詢問收發保護機制,在用戶發聲的過程中感知信息是否為重放信號;若感知信息被認定為重放信號,則拒絕當前語音命令請求;若感知信息真實有效,則將感知信息和語音命令對應的音頻信號進行后續處理和認證;
S4、對語音信號進行降噪和有聲部分檢測,轉換為時-頻譜圖后提取射頻信號相位信息,并進行濾波、目標區域檢測、等比例伸縮和歸一化操作;
S5、將步驟S4處理過的語音和射頻感知數據通過兩個分支同時輸入神經網絡,進行用戶身份認證。
2.根據權利要求1所述的融合用戶多源發聲特征的身份認證方法,其特征在于,步驟S4中,通過設置相對能量
3.根據權利要求1所述的融合用戶多源發聲特征的身份認證方法,其特征在于,步驟S5中,設計基于CNN的雙分支殘差神經網絡,引入與多源信息融合相關的損失函數和對應的權重,實現對用戶身份的認證,具體為:
采用多通道的2維CNN殘差神經網絡進行語音數據的特征提取,提取特征定義為θvoi;采用多通道1維CNN殘差神經網絡進行射頻感知數據特征提取,提取特征定義為θsen;兩個分支末端均包含一個全連接層,并采用預測結果和真實值的交叉熵作為損失函數,即
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安交通大學,未經西安交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010790392.1/1.html,轉載請聲明來源鉆瓜專利網。





