[發(fā)明專利]一種智能雙錄質(zhì)檢方法和系統(tǒng)在審

申請?zhí)枺?/td>	202210042165.X	申請日：	2022-01-14
公開（公告）號：	CN114495216A	公開（公告）日：	2022-05-13
發(fā)明（設計）人：	曾德;胡峻潔;戶劉軍;劉小婷	申請（專利權）人：	四川科瑞軟件有限責任公司
主分類號：	G06V40/16	分類號：	G06V40/16;G06K9/62;G06N3/04;G06N3/08;G10L15/26;G10L25/63;G06V10/74;G06V10/82
代理公司：	北京天達知識產(chǎn)權代理事務所(普通合伙) 11386	代理人：	劉鏡
地址：	621000***	國省代碼：	四川;51
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種智能質(zhì)檢方法系統(tǒng)
鉆瓜網(wǎng) 技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種智能雙錄質(zhì)檢方法，其特征在于，包括以下步驟：

實時獲取每段雙錄視頻流和對應的體征數(shù)據(jù)；

對每段雙錄視頻流進行解碼獲得視頻數(shù)據(jù)和音頻數(shù)據(jù)；基于所述視頻數(shù)據(jù)進行人臉識別檢測，得到人臉識別檢測結果；基于所述視頻數(shù)據(jù)、音頻數(shù)據(jù)和所述體征數(shù)據(jù)進行脅迫檢測，得到脅迫檢測分數(shù)；

將所有視頻流的音頻文件拼接為雙錄音頻文件，對所述雙錄音頻文件進行語音識別得到語音文本，基于所述語音文本進行話術檢測得到話術檢測分數(shù)；

基于人臉識別檢測結果、脅迫檢測分數(shù)，以及所述話術檢測分數(shù)得到雙錄質(zhì)檢結果。

2.根據(jù)權利要求1所述的智能雙錄質(zhì)檢方法，其特征在于，基于所述視頻數(shù)據(jù)進行人臉識別檢測，得到人臉識別檢測結果，包括：基于第一段視頻流的視頻數(shù)據(jù)進行人臉識別檢測，得到人臉識別檢測結果；

基于所述視頻數(shù)據(jù)、音頻數(shù)據(jù)和所述體征數(shù)據(jù)進行脅迫檢測，得到脅迫檢測分數(shù)，包括：

基于第二段至最后一段視頻流的視頻數(shù)據(jù)、音頻數(shù)據(jù)和對應的體征數(shù)據(jù)進行脅迫檢測，得到脅迫檢測分數(shù)。

3.根據(jù)權利要求1所述的智能雙錄質(zhì)檢方法，其特征在于，所述基于人臉識別檢測結果、脅迫檢測分數(shù)，以及所述話術檢測分數(shù)到雙錄質(zhì)檢結果，包括：

當人臉識別檢測結果為不通過，則雙錄質(zhì)檢結果為不通過；

當人臉識別檢測結果為通過，則根據(jù)公式Z＝α₁X₄+β₁X₅計算雙錄質(zhì)檢分數(shù)；其中，X₄表示脅迫檢測分數(shù)，α₁表示脅迫檢測的權重，X₅表示話術檢測分數(shù)，β₁表示話術檢測的權重；

若所述雙錄質(zhì)檢分數(shù)低于第一閾值，則雙錄質(zhì)檢不通過；否則雙錄質(zhì)檢通過。

4.根據(jù)權利要求2所述的智能雙錄質(zhì)檢方法，其特征在于，基于第一段視頻流的視頻數(shù)據(jù)進行人臉識別檢測，得到人臉識別檢測結果，包括：

提取所述視頻數(shù)據(jù)中的多張關鍵幀圖像；

對于每張關鍵幀圖像，基于預設的人臉識別模型在所述關鍵幀圖像中提取人臉圖像；根據(jù)人臉圖像在所述關鍵幀圖像中的位置，采用相似度匹配算法對人臉圖像和目標人臉圖像進行相似度匹配，得到所述關鍵幀圖像的相似度匹配結果；根據(jù)所述多張關鍵幀的相似度匹配結果得到人臉識別檢測結果。

5.根據(jù)權利要求4所述的智能雙錄質(zhì)檢方法，其特征在于，根據(jù)人臉圖像在所述關鍵幀圖像中的位置，采用相似度匹配算法對人臉圖像和目標人臉圖像進行相似度匹配，得到所述關鍵幀圖像的相似度匹配結果；根據(jù)所述多張關鍵幀的相似度匹配結果得到人臉識別檢測結果，包括：

在每張關鍵幀圖像中，計算每張人臉的中心位置與所述關鍵幀圖像的中心位置的距離；

從最靠近關鍵幀圖像中心位置的人臉圖像開始到最遠離關鍵幀圖像中心位置的人臉圖像為止，依次采用相似度匹配算法與目標人臉圖像進行相似度匹配，若當前人臉圖像與目標人臉圖像相似，則匹配結束，該關鍵幀圖像為合規(guī)圖像；否則繼續(xù)的提取下一張人臉圖像與目標人臉圖像進行相似度匹配；

若當前關鍵幀圖像中不存在與目標人臉圖像的相似的人臉圖像，則判斷該關鍵幀圖像不合規(guī)；

根據(jù)合規(guī)關鍵幀圖像的數(shù)量與所述關鍵幀圖像總數(shù)量的比值，得到人臉識別檢測結果。

6.根據(jù)權利要求2所述的智能雙錄質(zhì)檢方法，其特征在于，基于第二段至最后一段視頻流的視頻數(shù)據(jù)、音頻數(shù)據(jù)和對應的體征數(shù)據(jù)進行脅迫檢測，得到脅迫檢測分數(shù)，包括：

對于第二段至最后一段視頻流的每段視頻流，基于所述視頻數(shù)據(jù)、音頻數(shù)據(jù)和對應的體征數(shù)據(jù)進行脅迫檢測，得到每段視頻流的脅迫概率；

對第二段至最后一段視頻流的每段視頻流的脅迫概率取平均得到平均脅迫概率；基于平均脅迫概率，得到脅迫檢測分數(shù)。

下載完整專利技術內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于四川科瑞軟件有限責任公司，未經(jīng)四川科瑞軟件有限責任公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202210042165.X/1.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

專利分類

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】