[發明專利]一種文件的批量抽樣方法及裝置有效
| 申請號: | 201910973760.3 | 申請日: | 2019-10-14 |
| 公開(公告)號: | CN110928847B | 公開(公告)日: | 2022-10-04 |
| 發明(設計)人: | 龐浩;梁偉標;文雪芹 | 申請(專利權)人: | 佛山科學技術學院 |
| 主分類號: | G06F16/16 | 分類號: | G06F16/16 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 蔡偉杰 |
| 地址: | 528000 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文件 批量 抽樣 方法 裝置 | ||
本發明涉及信息處理技術領域,具體涉及一種文件的批量抽樣方法及裝置,首先獲取所述第一文件夾中第一子文件夾的數量m,每個第一子文件夾的文件名;接著在所述第二文件夾中生成m個第二子文件夾,m個所述第二子文件夾的文件名分別與第一子文件夾的文件名對應;進而確定抽取比例,根據抽取比例從所述第一子文件夾中隨機抽取得到樣本文件,對所述樣本文件標記所屬第一子文件夾的文件名;根據所述樣本文件所屬第一子文件夾的文件名匹配目標數據庫中對應的第二子文件夾,將所述樣本文件移動到所述對應的第二子文件夾,本發明可以快速的對文件進行批量抽樣。
技術領域
本發明涉及信息處理技術領域,具體涉及一種文件的批量抽樣方法及裝置。
背景技術
隨著人工智能技術席卷而來,各個行業在新技術的注入下煥發生機,例如在智能設計領域,需要對包括圖片、視頻、文本文檔、PDF等不同類型的文檔進行批量處理,例如文件匯總,篩選等,傳統的人工復制粘貼耗費大量的時間和人力。
現有技術中,也沒有一套針對多文件夾分類抽樣的便捷方式。
發明內容
為解決上述問題,本發明提供一種文件的批量抽樣方法及裝置,可以快速的對文件進行批量抽樣。
為了實現上述目的,本發明提供以下技術方案:
根據本發明第一方面實施例的一種文件的批量抽樣方法,包括:
根據源數據庫的存放路徑讀取源數據庫中待抽樣的第一文件夾;
遍歷所述第一文件夾下所有的第一子文件夾,獲取所述第一文件夾中第一子文件夾的數量m,每個第一子文件夾的文件名;
根據目標數據庫的存放路徑讀取目標數據庫中存放抽樣樣本的第二文件夾;
在所述第二文件夾中生成m個第二子文件夾,m個所述第二子文件夾的文件名分別與第一子文件夾的文件名對應;
確定抽取比例,根據抽取比例從所述第一子文件夾中隨機抽取得到樣本文件,對所述樣本文件標記所屬第一子文件夾的文件名;
根據所述樣本文件所屬第一子文件夾的文件名匹配目標數據庫中對應的第二子文件夾,將所述樣本文件移動到所述對應的第二子文件夾。
進一步地,在根據目標數據庫的存放路徑讀取目標數據庫中存放抽樣樣本的第二文件夾之前,包括:
在目標數據庫中新建第二文件夾,所述第二文件夾為空白文件夾。
進一步地,所述確定抽取比例具體為:
對所述第一文件夾下所有的第一子文件夾設置一個共同的抽取比例,或
分別設置每個所述第一子文件夾的抽取比例。
進一步地,在遍歷所述第一文件夾下所有的第一子文件夾之后,還包括:
獲取所述第一子文件夾包含的源文件數量,當所述第一文件夾包含的源文件數量為0時,將所述第一文件夾標記為空白文件夾。
根據本發明第二方面實施例的一種文件的批量抽樣裝置,其特征在于,所述裝置包括:存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,所述計算機程序被所述處理器執行時實現如本發明第一方面中所述的文件的批量抽樣方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于佛山科學技術學院,未經佛山科學技術學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910973760.3/2.html,轉載請聲明來源鉆瓜專利網。





