日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]融合通道注意力和選擇性特征融合機制的唇語識別方法有效

專利信息
申請?zhí)枺?/td> 202110366767.6 申請日: 2021-04-06
公開(公告)號: CN113033452B 公開(公告)日: 2022-09-16
發(fā)明(設(shè)計)人: 薛峰;楊添;王文博;洪自坤 申請(專利權(quán))人: 合肥工業(yè)大學(xué)
主分類號: G06V40/20 分類號: G06V40/20;G06V40/16;G06V20/40;G06V10/774;G06V10/80;G06V10/82;G06N3/04;G06N3/08
代理公司: 安徽省合肥新安專利代理有限責(zé)任公司 34101 代理人: 陸麗莉;何梅生
地址: 230009 安*** 國省代碼: 安徽;34
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 融合 通道 注意力 選擇性 特征 機制 識別 方法
【權(quán)利要求書】:

1.一種融合通道注意力和選擇性特征融合機制的唇語識別方法,其特征是按如下步驟進行:

步驟1、獲取句子級別的唇語識別視頻數(shù)據(jù)集,并對唇語識別視頻數(shù)據(jù)集中的每個視頻進行人臉特征檢測,提取出嘴唇區(qū)域圖像,從而得到每個視頻的嘴唇區(qū)域圖像集合,并構(gòu)成嘴唇區(qū)域圖像數(shù)據(jù)集L;

步驟2、將所述嘴唇區(qū)域圖像數(shù)據(jù)集L劃分為訓(xùn)練集L1和測試集L2,并將所述訓(xùn)練集L1劃分為多個批次,每個批次包含B個視頻對應(yīng)的嘴唇區(qū)域圖像集合并作為B個訓(xùn)練樣本;每個訓(xùn)練樣本包含T幀嘴唇區(qū)域圖像;每幀嘴唇區(qū)域圖像的通道數(shù)為C、高為H、寬為W;

步驟3、將訓(xùn)練集L1與測試集L2中包含的每個視頻的嘴唇區(qū)域圖像集合所對應(yīng)的真實文本分別記為G1和G2

步驟4、構(gòu)建融合通道注意力和選擇性特征融合機制的唇語識別網(wǎng)絡(luò);

步驟4.1、構(gòu)建融合通道注意力機制的前端網(wǎng)絡(luò)HN;

所述前端網(wǎng)絡(luò)HN由三個相同的子模塊CAN串聯(lián)組成,每個子模塊CAN依次包括一個3D卷積層、一個3D批正則化層、一個ReLU激活函數(shù)、一個3D Dropout層、一個3D最大池化層以及一個通道注意力網(wǎng)絡(luò)層CA;并將通道注意力網(wǎng)絡(luò)CA的輸出與通道注意力網(wǎng)絡(luò)CA的輸入逐元素相乘后得到的結(jié)果作為每個子模塊CAN的輸出;

所述通道注意力網(wǎng)絡(luò)CA包括兩個支路,第一個支路依次包括:一個3D全局最大池化層,一個將輸入特征通道數(shù)縮小r倍的3D卷積層,一個ReLU激活函數(shù)以及一個將輸入特征通道數(shù)增大r倍的3D卷積層;另一個支路除將3D全局最大池化層改為3D全局平均池化層以外,與第一個支路相同;將兩個支路的輸出經(jīng)過逐元素相加后,再經(jīng)過Sigmoid激活函數(shù)得到注意力網(wǎng)絡(luò)CA的輸出;

步驟4.2、構(gòu)建選擇性特征融合網(wǎng)絡(luò)SKN;

所述選擇性特征融合網(wǎng)絡(luò)SKN由n個相同的選擇性融合子模塊SK串聯(lián)組成,每個選擇性融合子模塊SK按照如式(1)進行處理:

式(1)中,Z表示每個選擇性融合子模塊SK的輸出;代表特征矩陣逐元素相乘操作;tanh為Tanh激活函數(shù);X和Y是選擇性融合子模塊SK的輸入經(jīng)過兩個融合支路得到的兩個不同的特征矩陣,每個融合支路均包括一個全連接層;G(U)表示將兩個融合支路得到的兩個不同的特征矩陣X和Y逐元素相加后的結(jié)果U,再依次經(jīng)過一個將輸入維度縮小r倍的全連接層,一個ReLU激活函數(shù),一個將輸入維度增大r倍的全連接層以及一個Sigmoid激活函數(shù)的操作;

步驟4.3、構(gòu)建長時信息提取的后端網(wǎng)絡(luò)TN;

所述后端網(wǎng)絡(luò)TN依次包括兩層雙向GRU層,一個全連接層以及一個CTC loss層;所述后端網(wǎng)絡(luò)TN的輸入為所述選擇性特征融合網(wǎng)絡(luò)SKN的輸出;

步驟4.4、以所述訓(xùn)練集L1作為所述唇語識別網(wǎng)絡(luò)的輸入,并以與所述訓(xùn)練集L1所對應(yīng)的真實文本集合G1作為標簽,采用CTC loss作為損失函數(shù),再利用Adam優(yōu)化算法對所述唇語識別網(wǎng)絡(luò)進行訓(xùn)練,并結(jié)合所述唇語識別網(wǎng)絡(luò)在測試集L2上的效果,得到最終的唇語識別網(wǎng)絡(luò),用于實現(xiàn)對視頻中說話人嘴唇的運動進行識別,即實現(xiàn)機器唇讀。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于合肥工業(yè)大學(xué),未經(jīng)合肥工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202110366767.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

同類專利
專利分類
×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設(shè)計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 综合欧美一区二区三区| 国产午夜精品一区二区理论影院| 国产一级一区二区三区| 亚洲国产精品一区二区久久hs | 黄色av中文字幕| 日本一区二区三区四区高清视频| 亚洲欧美一区二| 日韩一级视频在线| 国产69精品久久久久999小说| 日本五十熟hd丰满| 国产日产精品一区二区| 欧美日韩亚洲另类| 高清欧美xxxx| 97久久久久亚洲| 国产精品综合在线观看| 国产一区观看| 欧美日韩一区视频| 99久久www免费| 黄色国产一区二区| 国产乱xxxxx97国语对白| 国产精品九九九九九| 欧美三级午夜理伦三级老人| 少妇bbwbbwbbw高潮| 久久精品国产一区二区三区| 亚洲欧美日韩视频一区| 国产清纯白嫩初高生在线播放性色 | 欧美二区在线视频| 亚洲网久久| 欧美激情图片一区二区| 午夜三级大片| 欧美一区二三区| 538国产精品| 99色精品视频| 日本福利一区二区| 日本高清h色视频在线观看| 99久久精品国产国产毛片小说| 欧美一区二区三区久久综合| 99三级视频| 久久天天躁夜夜躁狠狠躁2022| 免费观看又色又爽又刺激的视频 | 国产午夜一级片| 午夜爱爱电影| 国产香蕉97碰碰久久人人| 国产精品欧美久久久久一区二区| 二区三区免费视频| 91区国产| 乱淫免费视频| 国产69精品久久| 日本护士hd高潮护士| 国产三级精品在线观看| 亚洲国产99| 国产精品女人精品久久久天天| 国产91久| 精品久久综合1区2区3区激情| 国产www亚洲а∨天堂| 久久99精品一区二区三区| 日韩av不卡一区| 国产精品区一区二区三| 91麻豆精品一区二区三区| 国产一区三区四区| 国产一区二区高潮| 国产麻豆一区二区三区在线观看 | 国产精品第157页| 中文字幕视频一区二区| 亚洲一区二区三区加勒比| 99精品黄色| 欧美日韩一区二区在线播放| 少妇中文字幕乱码亚洲影视| 狠狠插狠狠爱| www.久久精品视频| 国产一区www| 91精品婷婷国产综合久久竹菊| 精品99在线视频| 强制中出し~大桥未久10在线播放| 亚洲国产精品网站| 免费xxxx18美国| 国产欧美一区二区精品婷| 精品久久久久久中文字幕 | 欧美一区二区三区另类| 中文字幕二区在线观看| 99爱国产精品| 国产清纯白嫩初高生视频在线观看|