[發明專利]一種基于人臉年齡檢測的公交專座語音播報方法與裝置在審
| 申請號: | 202210199578.9 | 申請日: | 2022-03-02 |
| 公開(公告)號: | CN114677724A | 公開(公告)日: | 2022-06-28 |
| 發明(設計)人: | 顏曉紅;王偉杰;郝學元;王洪超;孫煒 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06V20/40;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08;G06Q50/26 |
| 代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 田凌濤 |
| 地址: | 210003 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 年齡 檢測 公交 專座 語音 播報 方法 裝置 | ||
1.一種基于人臉年齡檢測的公交專座語音播報方法,其特征在于,按如下步驟S1-步驟S5,獲得老幼人群檢測模型,然后應用老幼人群檢測模型,完成對目標人群中老幼對象的檢測;
S1.以預設固定圖像獲取姿態,實時采集包括目標人群所有人臉部位的視頻;
S2.以包括目標人群所有人臉部位的視頻為輸入,基于圖像增強預處理,以預設大小的各人臉部位局部圖像為輸出,構建面部識別模塊;
S3.以各人臉部位局部圖像為輸入,基于卷積神經網絡,根據各人臉部位按預設映射規則所對應的年齡段標簽,以目標人群所有人臉部位分別所對應的年齡段標簽為輸出,構建人臉年齡檢測模塊;
S4.以目標人群所有人臉部位分別所對應的年齡段標簽為輸入,若存在高于預設上限值或低于預設下限值的年齡段標簽,則判定為目標人群中存在老幼對象,否則判定為目標人群中不存在老幼對象,以目標人群中是否存在老幼對象的狀態為輸出,構建老幼對象檢測模塊;
S5.基于面部識別模塊、人臉年齡檢測模塊、老幼對象檢測模塊,以實時采集包括目標人群所有人臉部位的視頻為輸入,以目標人群中是否存在老幼對象的狀態為輸出,構建老幼人群檢測模型。
2.如權利要求1所述的一種基于人臉年齡檢測的公交專座語音播報方法,其特征在于,步驟S2中所述圖像增強預處理包括隨機裁剪、隨機旋轉。
3.如權利要求1所述的一種基于人臉年齡檢測的公交專座語音播報方法,其特征在于,在步驟S3中的卷積神經網絡中添加padding層,以補齊輸入人臉年齡檢測模塊的各人臉部位視頻幀的尺寸差異,使卷積神經網絡的卷積層輸入維度和輸出維度一致,具體如下式:
式中,Hout為輸出圖像的高度,Hin為輸入圖像的高度,Wout為輸出圖像的寬度,Win為輸入圖像的寬度,kernelsize[m]為各卷積神經網絡池化核的大小,stride[m]為卷積過程中橫向縱向的路徑長短,默認為1,padding[m]表示對輸入圖像的邊緣進行填充,dilation[m]表示空洞卷積;m取0或1,[0]用于表示輸入層上的參數,[1]用于表示輸出層上的參數;
在所述卷積神經網絡中添加局部響應歸一化層,以提高卷積神經網絡的泛化能力,具體如下式:
式中,表示輸入局部響應歸一化層的值,是經過局部響應歸一化層處理后輸出的值,a為預設通道參數,i為通道位置,j為中的最大值,x、y為待更新像素的橫縱坐標,k為預設的偏置量,n為通道編號,N為通道總數,α、β為預設的超參數。
4.如權利要求3所述的一種基于人臉年齡檢測的公交專座語音播報方法,其特征在于,步驟S3中所述年齡段標簽共8個,分別為(0-2)、(4-6)、(8-12)、(15-20)、(25-32)、(38-43)、(48-53)、(60-100)。
5.如權利要求4所述的一種基于人臉年齡檢測的公交專座語音播報方法,其特征在于,步驟S3中基于隨機梯度下降法使所述卷積神經網絡達到收斂,具體如下式:
式中,J(i)(θ0,θ1)為損失函數,hθ(xi)為預測函數,θ為求導角度;
對J(i)(θ0,θ1)進行求導:
式中,θj為目標函數;
對目標函數θj進行參數更新:
式中,θ′j為更新參數后的目標函數,α0為學習率,為θj賦初始值,然后向使J(i)(θ0,θ1)變化最大方向更新目標函數θj的取值,直至預設最大迭代次數。
6.一種基于人臉年齡檢測的公交專座語音播報裝置,其特征在于,包括第一攝像頭、至少一個第二攝像頭、第一老幼人群檢測模塊、至少一個第二老幼人群檢測模塊、語音播報模塊、主控模塊,使得所述人臉年齡檢測的公交專座語音播報裝置實現如權利要求1-5中任意一項所述一種基于人臉年齡檢測的公交專座語音播報方法;
其中第二攝像頭、第二老幼人群檢測模塊數量相同,用于實時采集上車乘客所有人臉部位視頻的第一攝像頭固定安裝于公交車上車門處,用于實時采集使用公交專座乘客人臉部位的視頻的各第二攝像頭與各公交專座一一對應,分別固定安裝于每個公交專座處,第一攝像頭、主控模塊分別均與第一老幼人群檢測模塊相連接,各第二攝像頭分別與各第二老幼人群檢測模塊一一對應相連接,各第二老幼人群檢測模塊均與主控模塊相連接,主控模塊與語音播報模塊相連接,第一老幼人群檢測模塊、各第二老幼人群檢測模塊分別均包括面部識別模塊、人臉年齡檢測模塊、老幼對象檢測模塊,當第一老幼人群檢測模塊檢測到上車乘客中存在老幼對象,且各第二老幼人群檢測模塊檢測到使用公交專座乘客中不存在老幼對象時,主控模塊驅動語音播報模塊發出預設語音提示聲音。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210199578.9/1.html,轉載請聲明來源鉆瓜專利網。





