[發明專利]基于分布式系統的樣本采集方法、裝置、設備及介質有效
| 申請號: | 202010728386.3 | 申請日: | 2020-07-27 |
| 公開(公告)號: | CN111597388B | 公開(公告)日: | 2021-03-19 |
| 發明(設計)人: | 王水桃;黃哲 | 申請(專利權)人: | 平安國際智慧城市科技股份有限公司 |
| 主分類號: | G06F16/783 | 分類號: | G06F16/783;G06N3/04;G06N3/08;H04N5/91 |
| 代理公司: | 深圳市世聯合知識產權代理有限公司 44385 | 代理人: | 汪琳琳 |
| 地址: | 518000 廣東省深圳市前海深港合*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 分布式 系統 樣本 采集 方法 裝置 設備 介質 | ||
本申請實施例公開了一種基于分布式系統的樣本采集方法、裝置、設備及介質,涉及數據采集技術領域。該方法包括:接收樣本采集指令,設置定時采集任務;獲取采集設備的設備信息并同步至本地存儲的歷史采集設備的設備信息中;觸發定時采集任務;讀取目標采集設備的設備信息,以獲取設備標識符;識別出目標采集設備并建立通信連接,訪問目標采集設備獲取其視頻流,從視頻流中抓取若干份樣本數據進行保存。本申請還涉及區塊鏈技術,將樣本數據存儲至區塊鏈網絡。所述方法通過對真實場景中合理的時間段安排,和定時啟動分布式任務抓拍場景樣本數據,既實現了自動化的樣本采集,減少了工作人員的操作量,又極大地提高了樣本收集的速度及質量。
技術領域
本申請涉及數據采集技術領域,特別是一種基于分布式系統的樣本采集方法、裝置、設備及介質。
背景技術
人工智能有三要素,它們分別是數據、算力和算法。因為人工智能的根基是訓練,只有通過大量的訓練,神經網絡才能總結出規律,應用到新的樣本上。具體到目標識別領域,數據則是圖片樣本。對于需要深度學習的目標識別來說,網絡越大,層數越多,需要的訓練樣本量也越多。
傳統收集樣本的方法主要有以下幾種:1、從公開數據集中獲取;2、從網絡上的圖片庫中獲取,例如百度圖片;3、從數據提供方中購買。
對于上述方式中的第1、2種,其能收集到的真實場景樣本數量有限,而且,僅靠人工收集的速度太慢。此外,這兩種方式獲取到的樣本的質量并不高,無論是圖片的分辨率還是大小,與現實場景中的監控圖片都有較大差別。而對于第3種方式,目前市場上也沒有相關的數據提供方可以提供符合一些特定真實場景的樣本,如后廚視頻智能識別系統所需的樣本,用于滿足后廚違規場景識別模型的訓練。
發明內容
本申請實施例所要解決的技術問題是,提供一種基于分布式系統的樣本采集方法、裝置、設備及存儲介質,減少人工工作量,提高真實場景下樣本收集的速度及質量。
為了解決上述技術問題,本申請實施例提供一種基于分布式系統的樣本采集方法,采用了如下所述的技術方案:
一種基于分布式系統的樣本采集方法,包括:
接收樣本采集指令,并響應于所述樣本采集指令設置定時采集任務,所述樣本采集指令中指定有目標采集時間;
獲取采集設備的設備信息并同步至本地存儲的歷史采集設備的設備信息中,所述設備信息包括每個活躍的采集設備的設備標識符;
實時監控系統時間,在所述系統時間到達所述目標采集時間時,觸發所述定時采集任務;
基于所述定時采集任務讀取目標采集設備的設備信息,以獲取所述設備信息中的設備標識符;
根據設備標識符識別出與之匹配的目標采集設備并建立通信連接,訪問所述目標采集設備的接口地址獲取其視頻流,從所述視頻流中抓取若干份樣本數據進行保存。
為了解決上述技術問題,本申請實施例還提供一種基于分布式系統的樣本采集裝置,采用了如下所述的技術方案:
一種基于分布式系統的樣本采集裝置,包括:
任務設置模塊,用于接收樣本采集指令,并響應于所述樣本采集指令設置定時采集任務,所述樣本采集指令中指定有目標采集時間;
信息同步模塊,用于獲取采集設備的設備信息并同步至本地存儲的歷史采集設備的設備信息中,所述設備信息包括每個活躍的采集設備的設備標識符;
任務觸發模塊,用于實時監控系統時間,在所述系統時間到達所述目標采集時間時,觸發所述定時采集任務;
信息讀取模塊,用于基于所述定時采集任務讀取目標采集設備的設備信息,以獲取所述設備信息中的設備標識符;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安國際智慧城市科技股份有限公司,未經平安國際智慧城市科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010728386.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種多音字讀音預測方法、裝置及計算機可讀存儲介質
- 下一篇:觸控顯示裝置





