[發明專利]基于海量數據的模型評價方法、裝置、設備及存儲介質在審
| 申請號: | 202110842391.1 | 申請日: | 2021-07-26 |
| 公開(公告)號: | CN113505730A | 公開(公告)日: | 2021-10-15 |
| 發明(設計)人: | 陳釗 | 申請(專利權)人: | 全景智聯(武漢)科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N20/00 |
| 代理公司: | 深圳至誠化育知識產權代理事務所(普通合伙) 44728 | 代理人: | 劉英 |
| 地址: | 430000 湖北省武漢市東湖新*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 海量 數據 模型 評價 方法 裝置 設備 存儲 介質 | ||
1.一種基于海量數據的模型評價方法,其特征在于,所述基于海量數據的模型評價方法包括以下步驟:
從緩存中獲取海量圖片信息,將所述海量圖片信息整理為樣本數據集;
將所述樣本數據集以均勻分布的方式分為訓練集和測試集;
根據所述訓練集對海量數據聚類模型進行訓練,根據所述測試集對訓練后的數據聚類模型進行隨機n次驗證,最終返回n次測試結果,n為大于等于1的整數;
根據所述n次測試結果,計算各混淆矩陣的查準率和查全率;
根據各所述混淆矩陣的查準率和查全率,計算宏查準率、宏查全率和宏F1;
根據所述宏查準率、宏查全率和宏F1評價訓練后的數據聚類模型。
2.如權利要求1所述的基于海量數據的模型評價方法,其特征在于,所述從緩存中獲取海量圖片信息,將所述海量圖片信息整理為樣本數據集之前,還包括:
獲取目標社區人臉抓拍圖片流;
對所述人臉抓拍圖片流進行結構化處理,獲得結構化圖片數據;
清洗所述結構化圖片數據中未識別人臉的無效圖片,獲得已清洗圖片;
將所述已清洗圖片按照所述目標社區分類保存至緩存。
3.如權利要求2所述的基于海量數據的模型評價方法,其特征在于,所述將所述已清洗圖片按照所述目標社區分類保存至緩存,具體包括:
將所述已清洗圖片調整為統一圖片格式及大小,獲得已調整圖片;
獲取所述已調整圖片中人臉的性別特征,根據所述性別特征將所述已調整圖片按照所述目標社區進行分類保存至緩存。
4.如權利要求3所述的基于海量數據的模型評價方法,其特征在于,所述獲取所述已調整圖片中人臉的性別特征,根據所述性別特征將所述已調整圖片按照所述目標社區進行分類保存至緩存,具體包括:
獲取所述已調整圖片中小區編號、人臉的性別特征及時間戳;
根據所述時間戳給每一張所述已調整圖片生成對應的人臉標識;
將所述已調整圖片,以所述小區編號作為第一維度、以所述人臉的性別特征為第二維度、以所述人臉標識作為第三維度,進行分類,并將分類結果保存至緩存。
5.如權利要求4所述的基于海量數據的模型評價方法,其特征在于,所述根據所述時間戳給每一張所述已調整圖片自動生成一個人臉標識,具體包括:
根據所述時間戳和預設位數的隨機數,給每一張所述已調整圖片生成對應的人臉標識。
6.如權利要求1所述的基于海量數據的模型評價方法,其特征在于,所述根據所述測試集對訓練后的數據聚類模型進行隨機n次驗證,具體包括:
步驟S1,將所述樣本數據集D拆分成10個樣本子集分別是D1到D10;
步驟S2,開始進行第m(1≤m≤n)次樣本測試,樣本子集D1從緩存數據庫的每個小區各隨機取一名男性樣本,并標記此樣本為不可用;
步驟S3,樣本子集D2從緩存數據庫的每個小區各隨機取一名女性樣本,并標記此樣本為不可用;
步驟S4,對其余的樣本子集重復步驟S2和S3,10個樣本子集經過一輪取樣后,判斷所述樣本數據集D是否有可用樣本,若有,則再次從頭開始循環,直至所述樣本數據集D里的所有樣本都為不可用標記為止;
步驟S5,將樣本集S=D1∪D2∪……∪Di(1≤i≤n,且i≠n-m+1)作為訓練集,使用聚類算法訓練樣本集S得到聚類算法模型;
步驟S6,根據步驟S5得到的聚類算法模型對所述樣本數據集D(n-m+1)作測試,得到測試結果為多類混淆矩陣;
重復n次上述步驟S2到步驟S6,得到n個多類混淆矩陣。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于全景智聯(武漢)科技有限公司,未經全景智聯(武漢)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110842391.1/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





