[發明專利]基于異常檢測和半監督的超聲關鍵幀自主識別方法有效
| 申請號: | 202110010282.3 | 申請日: | 2021-01-04 |
| 公開(公告)號: | CN112908465B | 公開(公告)日: | 2023-06-02 |
| 發明(設計)人: | 黃慶華;習佳寧;李學龍 | 申請(專利權)人: | 西北工業大學 |
| 主分類號: | G16H50/20 | 分類號: | G16H50/20;G06V10/774 |
| 代理公司: | 西安凱多思知識產權代理事務所(普通合伙) 61290 | 代理人: | 王鮮凱 |
| 地址: | 710072 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 異常 檢測 監督 超聲 關鍵 自主 識別 方法 | ||
1.一種基于異常檢測和半監督的超聲關鍵幀自主識別方法,其特征在于步驟如下:
步驟1,構建超聲視頻幀數據集:利用超聲探頭對人體不同組織區域進行視頻幀采集,得到帶位置坐標的超聲視頻數據集X=[x1,x2,...,xn],其中,xi表示第i個超聲視頻幀,i=1,2…,n,n為數據集包括的視頻幀總數;所述的組織區域包括脖子、胸部、手臂、腹部、后背、腰部和大腿;
步驟2,變分自編碼器對超聲幀的正態編碼向量提取:首先,根據無監督方式的變分自編碼器VAE的框架,分別構建編碼網絡和解碼網絡,其中,編碼網絡由三層神經網絡構成,其輸入為超聲視頻幀xi,以及從m維的標準正態分布N(0,Im)隨機采樣的相應隨機向量εi,Im為m維單位矩陣,m由用戶預設的正整數,取值范圍為[2000,10000],i∈[1,…,n],設編碼網絡的網絡參數集合為φ;編碼網絡的輸出為超聲視頻幀xi為所對應的編碼向量zi,(μφ)i為編碼向量zi的均值,維度為m×1,(Σφ)i為編碼向量zi的協方差矩陣,維度為m×m,正態分布函數N((μφ)i,(Σφ)i)構成編碼向量zi的后驗概率函數qφ(zi|xi);解碼網絡也由三層神經網絡構成,其輸入為編碼向量zi,輸出為通過編碼向量zi對超聲視頻幀xi進行重建的重建似然函數pθ(xi|zi),i∈[1,…,n],θ表示解碼網絡的網絡參數集合;
然后,通過隨機梯度下降法對下式進行優化,得到編碼器網絡和解碼器網絡參數φ和θ以及各超聲視頻幀的編碼向量zi,i∈[1,…,n]:
其中,表示似然函數pθ(xi|zi)的對數關于后驗概率函數qφ(zi|xi)=N((μφ)i,(Σφ)i)的期望值,DKL{qφ(zi|xi)||N(0,Im)}表示qφ(zi|xi)和N(0,Im)的KL散度;
步驟3,無監督離群點檢測方式的超聲關鍵幀預篩選:設定分位數α=0.05,對于數據集中的超聲視頻幀xi,i=1,2…,n,當其重建概率pi小于分位數α時,判定該視頻幀為離群點,并將其作為候選關鍵幀;否則,判定該輸入幀為平凡幀;
所述的重建概率pi按以下過程計算得到:從m維的標準正態分布N(0,Im)進行K次采樣,得到超聲視頻幀xi的相應隨機向量K在[1000,10000]內取值;將xi和作為輸入,通過步驟2的編碼網絡,得到均值(μφ)i、協方差矩陣(Σφ)i和編碼向量再將每個編碼向量代入解碼網絡,計算出相應的重建似然函數得到所有K個重建概率;將這K個重建概率的均值,作為超聲視頻幀xi最終的重建概率,即
步驟4,標注約束相似圖半監督學習視頻幀低秩分解:首先,對于步驟3從n個超聲視頻幀中所篩選出的L個候選關鍵幀,從中隨機選擇l個幀進行標注,得到關系記錄矩陣Cl×c,其中,lL,關系記錄矩陣的第i行j列元素[Cl×c]i,j=1表示所選擇的第i個候選關鍵幀屬于第j類關鍵幀,[Cl×c]i,j=0表示所選擇的第i個候選關鍵幀不屬于第j類,i=1,2…,l,j=1,2…,c,前c-1個類為不同類型的關鍵幀類別,第c類為平凡幀類別;
然后,按下式構建用于描述半監督學習標注關系的標注約束矩陣Y:
其中,In-l表示(n-l)維單位矩陣;
接著,構建標注約束低秩分解的半監督學習優化函數如下:
其中,矩陣Z=[z1,z2,...,zn]為由n個超聲視頻幀通過步驟2得到的編碼向量所構成的編碼向量矩陣,維度為m×n,矩陣U為從原始m維編碼向量特征到k維低秩特征的線性映射矩陣,維度為m×k;矩陣V為潛變量矩陣,其中,vi為k維的非負向量,向量vi中元素的初始值為(0,1)區間內等概率隨機產生,i=1,2…,c+(n-l),k是由用戶預設的正整數,在[100,2000]內取值;W為n×n維的相似性矩陣,其對角線元素取值均設置為1,非對角線元素wij為第i個編碼向量zi和第j個編碼向量zj的熱核函數權重,按照wij=exp{-||zi-zj||2/σ}計算得到,σ為擴散系數,由用戶設定,取值范圍為(0,+∞);D為度矩陣,是以相似性矩陣W的每行之和分別作為對角線元素的對角矩陣;λ是相似性正則化項的調諧參數,取值由用戶設定,取值范圍為(0,+∞);β是線性映射矩陣正則化項的調諧參數,取值由用戶設定,取值范圍為(0,+∞);
采用交替方向乘子法求解上述半監督學習優化函數,得到矩陣U和V;
步驟5,視頻幀編碼向量低秩偽逆的關鍵幀自主識別:對于新獲取的超聲視頻幀xn+1,按照下式得到其預測向量
其中,zn+1為按照步驟2方法獲得的該視頻幀的編碼向量;
記錄預測向量中最大元素值的位置序號in+1,再記錄步驟4所得的標注約束矩陣Y中第in+1行中元素值為1的列序號jn+1;若jn+1屬于[1,c-1]之內,則將超聲視頻幀xn+1視為第jn+1類關鍵幀;若jn+1=c,則將超聲視頻幀xn+1視為平凡幀。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西北工業大學,未經西北工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110010282.3/1.html,轉載請聲明來源鉆瓜專利網。





