[發明專利]融合用戶多源發聲特征的身份認證方法、存儲介質及設備有效

申請號：	202010790392.1	申請日：	2020-08-07
公開（公告）號：	CN112116742B	公開（公告）日：	2021-07-13
發明（設計）人：	趙衰;李鎮江;丁菡;惠維;王鴿;趙季中	申請（專利權）人：	西安交通大學
主分類號：	G10L17/00	分類號：	G10L17/00
代理公司：	西安通大專利代理有限責任公司 61200	代理人：	高博
地址：	710049 ***	國省代碼：	陜西;61
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	融合用戶發聲特征身份認證方法存儲介質設備
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種融合用戶多源發聲特征的身份認證方法，其特征在于，包括以下步驟：

S1、確定感知末端的尺寸，選擇RFID標簽數量和型號，構建感知末端，利用RFID射頻信號物理層信息，在用戶發出語音命令或認證口令過程中感知用戶嘴部運動；在每個標簽每次被成功讀取時獲得一次信號物理層信息，即感知信息；

S2、設計收發保護機制，在RFID讀寫器與感知末端的標簽通信過程中，在信號發射時加入動態隨機噪音，在接收信號時消除噪音并恢復標簽EPC，判斷感知信號真偽，根據RFID通信協議，讀寫器采取輪詢的方式與標簽進行通信，即每個通信周期內所有標簽被詢問一次且最多一次，每個標簽被詢問一次的通信過程包含Query、RN16、ACK和EPC，Query和ACK為讀寫器發出的命令，RN16和EPC是標簽的回復信號，在讀寫器發出ACK命令后，生成動態隨機噪音形式的連續載波，標簽將自身EPC調制到載波上并反向散射給讀寫器，實現動態隨機噪音的加載，在讀寫器每個輪詢周期的第一個問詢時隙，通過編程設置為空的問詢時隙，不允許標簽回復EPC信號，僅用于收發隨機噪音，估計短時信道狀態H用于同一個輪詢周期內所有標簽回復EPC段的噪音消除，收發保護機制具體為：在發射端加載動態隨機噪音保護通信內容，在接收端消除噪音恢復通信內容，動態隨機噪音僅收發雙發已知且不斷發生變化；

S3、識別用戶語音命令，若包含關鍵詞，根據步驟S2能否正確恢復感知末端標簽EPC確定進入步驟S4或拒接請求并結束，用戶或系統預先設置高風險關鍵詞，當用戶發起語音命令或認證口令時，先利用現有語音識別技術識別語音內容，若語音內容中不包含預設的高風險關鍵詞，不詢問收發保護機制，不進行用戶認證，直接執行命令相應的操作；當語音內容中包含預設的高風險關鍵詞時，啟動詢問收發保護機制，在用戶發聲的過程中感知信息是否為重放信號；若感知信息被認定為重放信號，則拒絕當前語音命令請求；若感知信息真實有效，則將感知信息和語音命令對應的音頻信號進行后續處理和認證；

S4、對語音信號進行降噪和有聲部分檢測，轉換為時-頻譜圖后提取射頻信號相位信息，并進行濾波、目標區域檢測、等比例伸縮和歸一化操作；

S5、將步驟S4處理過的語音和射頻感知數據通過兩個分支同時輸入神經網絡，進行用戶身份認證。

2.根據權利要求1所述的融合用戶多源發聲特征的身份認證方法，其特征在于，步驟S4中，通過設置相對能量P與過零率ZCR的閾值，對語音數據進行有聲部分檢測，定位用戶發聲的始末位置，通過時鐘同步截取射頻感知數據的目標區域；分別對語音和射頻感知數據做時-頻譜轉換和等比例伸縮，時-頻譜轉包括含25%～50%疊加的分幀、加窗和傅立葉變換，射頻感知數據的等比例伸縮，基于相鄰采樣點相對差值，和原始序列長度與目標序列長度比例系數實現；轉換后的RGB三通道時-頻譜圖通過調整像素比例固定尺寸，射頻感知數據伸縮至預設的固定長度。

3.根據權利要求1所述的融合用戶多源發聲特征的身份認證方法，其特征在于，步驟S5中，設計基于CNN的雙分支殘差神經網絡，引入與多源信息融合相關的損失函數和對應的權重，實現對用戶身份的認證，具體為：

采用多通道的2維CNN殘差神經網絡進行語音數據的特征提取，提取特征定義為θ_voi；采用多通道1維CNN殘差神經網絡進行射頻感知數據特征提取，提取特征定義為θ_sen；兩個分支末端均包含一個全連接層，并采用預測結果和真實值的交叉熵作為損失函數，即L_voi和L_sen，反向傳播更新各自特征提取網絡參數；然后對語音特征θ_voi 和射頻感知特征θ_sen進行特征空間對齊，采用二范數計算兩者距離作為損失函數L_jot更新兩個分支特征提取網絡的參數；特征融合之前對兩個分支所對應的交叉熵損失函數附加權重。