[發(fā)明專利]一種智能雙錄質(zhì)檢方法和系統(tǒng)在審
| 申請?zhí)枺?/td> | 202210042165.X | 申請日: | 2022-01-14 |
| 公開(公告)號: | CN114495216A | 公開(公告)日: | 2022-05-13 |
| 發(fā)明(設計)人: | 曾德;胡峻潔;戶劉軍;劉小婷 | 申請(專利權)人: | 四川科瑞軟件有限責任公司 |
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06K9/62;G06N3/04;G06N3/08;G10L15/26;G10L25/63;G06V10/74;G06V10/82 |
| 代理公司: | 北京天達知識產(chǎn)權代理事務所(普通合伙) 11386 | 代理人: | 劉鏡 |
| 地址: | 621000*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 智能 質(zhì)檢 方法 系統(tǒng) | ||
1.一種智能雙錄質(zhì)檢方法,其特征在于,包括以下步驟:
實時獲取每段雙錄視頻流和對應的體征數(shù)據(jù);
對每段雙錄視頻流進行解碼獲得視頻數(shù)據(jù)和音頻數(shù)據(jù);基于所述視頻數(shù)據(jù)進行人臉識別檢測,得到人臉識別檢測結果;基于所述視頻數(shù)據(jù)、音頻數(shù)據(jù)和所述體征數(shù)據(jù)進行脅迫檢測,得到脅迫檢測分數(shù);
將所有視頻流的音頻文件拼接為雙錄音頻文件,對所述雙錄音頻文件進行語音識別得到語音文本,基于所述語音文本進行話術檢測得到話術檢測分數(shù);
基于人臉識別檢測結果、脅迫檢測分數(shù),以及所述話術檢測分數(shù)得到雙錄質(zhì)檢結果。
2.根據(jù)權利要求1所述的智能雙錄質(zhì)檢方法,其特征在于,基于所述視頻數(shù)據(jù)進行人臉識別檢測,得到人臉識別檢測結果,包括:基于第一段視頻流的視頻數(shù)據(jù)進行人臉識別檢測,得到人臉識別檢測結果;
基于所述視頻數(shù)據(jù)、音頻數(shù)據(jù)和所述體征數(shù)據(jù)進行脅迫檢測,得到脅迫檢測分數(shù),包括:
基于第二段至最后一段視頻流的視頻數(shù)據(jù)、音頻數(shù)據(jù)和對應的體征數(shù)據(jù)進行脅迫檢測,得到脅迫檢測分數(shù)。
3.根據(jù)權利要求1所述的智能雙錄質(zhì)檢方法,其特征在于,所述基于人臉識別檢測結果、脅迫檢測分數(shù),以及所述話術檢測分數(shù)到雙錄質(zhì)檢結果,包括:
當人臉識別檢測結果為不通過,則雙錄質(zhì)檢結果為不通過;
當人臉識別檢測結果為通過,則根據(jù)公式Z=α1X4+β1X5計算雙錄質(zhì)檢分數(shù);其中,X4表示脅迫檢測分數(shù),α1表示脅迫檢測的權重,X5表示話術檢測分數(shù),β1表示話術檢測的權重;
若所述雙錄質(zhì)檢分數(shù)低于第一閾值,則雙錄質(zhì)檢不通過;否則雙錄質(zhì)檢通過。
4.根據(jù)權利要求2所述的智能雙錄質(zhì)檢方法,其特征在于,基于第一段視頻流的視頻數(shù)據(jù)進行人臉識別檢測,得到人臉識別檢測結果,包括:
提取所述視頻數(shù)據(jù)中的多張關鍵幀圖像;
對于每張關鍵幀圖像,基于預設的人臉識別模型在所述關鍵幀圖像中提取人臉圖像;根據(jù)人臉圖像在所述關鍵幀圖像中的位置,采用相似度匹配算法對人臉圖像和目標人臉圖像進行相似度匹配,得到所述關鍵幀圖像的相似度匹配結果;根據(jù)所述多張關鍵幀的相似度匹配結果得到人臉識別檢測結果。
5.根據(jù)權利要求4所述的智能雙錄質(zhì)檢方法,其特征在于,根據(jù)人臉圖像在所述關鍵幀圖像中的位置,采用相似度匹配算法對人臉圖像和目標人臉圖像進行相似度匹配,得到所述關鍵幀圖像的相似度匹配結果;根據(jù)所述多張關鍵幀的相似度匹配結果得到人臉識別檢測結果,包括:
在每張關鍵幀圖像中,計算每張人臉的中心位置與所述關鍵幀圖像的中心位置的距離;
從最靠近關鍵幀圖像中心位置的人臉圖像開始到最遠離關鍵幀圖像中心位置的人臉圖像為止,依次采用相似度匹配算法與目標人臉圖像進行相似度匹配,若當前人臉圖像與目標人臉圖像相似,則匹配結束,該關鍵幀圖像為合規(guī)圖像;否則繼續(xù)的提取下一張人臉圖像與目標人臉圖像進行相似度匹配;
若當前關鍵幀圖像中不存在與目標人臉圖像的相似的人臉圖像,則判斷該關鍵幀圖像不合規(guī);
根據(jù)合規(guī)關鍵幀圖像的數(shù)量與所述關鍵幀圖像總數(shù)量的比值,得到人臉識別檢測結果。
6.根據(jù)權利要求2所述的智能雙錄質(zhì)檢方法,其特征在于,基于第二段至最后一段視頻流的視頻數(shù)據(jù)、音頻數(shù)據(jù)和對應的體征數(shù)據(jù)進行脅迫檢測,得到脅迫檢測分數(shù),包括:
對于第二段至最后一段視頻流的每段視頻流,基于所述視頻數(shù)據(jù)、音頻數(shù)據(jù)和對應的體征數(shù)據(jù)進行脅迫檢測,得到每段視頻流的脅迫概率;
對第二段至最后一段視頻流的每段視頻流的脅迫概率取平均得到平均脅迫概率;基于平均脅迫概率,得到脅迫檢測分數(shù)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川科瑞軟件有限責任公司,未經(jīng)四川科瑞軟件有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210042165.X/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 質(zhì)檢方法、質(zhì)檢設備及質(zhì)檢系統(tǒng)
- 一種話務錄音的質(zhì)檢方法及裝置
- 一種智能凈水機線上質(zhì)檢方法、系統(tǒng)
- 質(zhì)檢方法、裝置、設備及存儲介質(zhì)
- 產(chǎn)品質(zhì)檢方法、裝置、設備及計算機可讀存儲介質(zhì)
- 一種視頻質(zhì)檢方法、系統(tǒng)及終端設備
- 智能質(zhì)檢方法、系統(tǒng)、介質(zhì)以及設備
- 一種語音質(zhì)檢方法、裝置、質(zhì)檢設備及可讀存儲介質(zhì)
- AI質(zhì)檢方法,裝置,系統(tǒng),電子設備及存儲介質(zhì)
- 基于知識階層的數(shù)據(jù)質(zhì)檢的方法、裝置及計算機設備





