[發明專利]基于RPA及AI的文件存儲方法、裝置、設備和介質在審
| 申請號: | 202010612419.8 | 申請日: | 2020-06-30 |
| 公開(公告)號: | CN111752900A | 公開(公告)日: | 2020-10-09 |
| 發明(設計)人: | 汪冠春;胡一川;褚瑞;李瑋;潘庚生;翁嘉頎 | 申請(專利權)人: | 北京來也網絡科技有限公司;北京奔影網絡科技有限公司 |
| 主分類號: | G06F16/16 | 分類號: | G06F16/16;G06F16/13;G06F16/11;G06F16/174;G06F16/35;G06K9/34 |
| 代理公司: | 北京科領智誠知識產權代理事務所(普通合伙) 11782 | 代理人: | 陳士騫 |
| 地址: | 100080 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 rpa ai 文件 存儲 方法 裝置 設備 介質 | ||
1.一種基于RPA及AI的文件存儲方法,其特征在于,包括:
S1、遍歷設定文件夾中未進行分類的文件數據;
S2、將所述文件數據進行分類;
S3、將所述文件數據依據分類結果進行存儲。
2.根據權利要求1所述的方法,其特征在于,所述步驟S2具體包括:
S21、將所述文件數據依據文件內容進行分類。
3.根據權利要求2所述的方法,其特征在于,所述步驟S21具體包括:
S211、根據所述文件數據的文件類型生成目錄樹;
S212、將所述目錄樹中的各文件數據依據文件內容進行分類。
4.根據權利要求3所述的方法,其特征在于,所述步驟S212具體包括:
S2121、基于光學字符識別OCR方法,對所述目錄樹中各文件數據的文件內容進行識別;
S2122、將各文件數據依據識別結果進行分類。
5.根據權利要求4所述的方法,其特征在于,所述步驟S2121具體包括:
分別調用本地和云端的OCR軟件,識別所述目錄樹中各文件數據的文件內容,得到本地識別結果和云端識別結果;
從所述本地識別結果和所述云端識別結果中,選擇置信度高的識別結果作為所述文件內容的識別結果。
6.根據權利要求4所述的方法,其特征在于,所述步驟S2122具體包括:
提取所述文件內容中的文本關鍵詞;
如果所述文本關鍵詞與預設關鍵詞相匹配,則將該預設關鍵詞對應的預設類別作為所述文件內容的分類結果。
7.根據權利要求4所述的方法,其特征在于,所述步驟S2122具體包括:
對所述文件內容進行分解,得到多個字段;
將所述多個字段輸入預設分類模型,并將所述預設分類模型輸出的類別作為所述文件內容的分類結果;
其中,所述預設分類模型采用已標注類別的文本作為訓練樣本,該預設分類模型建立了文本內容與其類別之間的對應關系。
8.根據權利要求1所述的方法,其特征在于,所述步驟S3具體包括:
S31、檢測第一文件存儲空間的存儲容量,如果所述存儲容量小于預設閾值,則將所述分類結果轉移到存儲容量大于所述預設閾值的第二文件存儲空間,并對所述轉移路徑進行記錄;
S32、將所述文件數據按照其分類結果在所述第二文件存儲空間中進行存儲。
9.根據權利要求1所述的方法,其特征在于,所述方法還包括:
S4、在將文件數據存入設定文件夾之前,判斷磁盤存儲空間的剩余存儲容量是否大于所述文件數據的大小;
S5、如果所述剩余存儲容量大于所述文件數據的大小,則將所述文件數據存入所述設定文件夾;
S6、如果所述剩余存儲容量小于所述文件數據的大小,則向用戶發送提示郵件。
10.根據權利要求1所述的方法,其特征在于:
如果所述文件數據為圖片,則在將所述圖片存入設定文件夾時,每張圖片壓縮后的大小不低于400KB。
11.一種基于RPA及AI的文件存儲裝置,其特征在于,包括:
文件遍歷模塊,被配置為遍歷設定文件夾中未進行分類的文件數據;
文件分類模塊,被配置為將所述文件數據進行分類;
文件存儲模塊,被配置為將所述文件數據依據分類結果進行存儲。
12.一種計算設備,其特征在于,所述設備包括:
存儲有可執行程序代碼的存儲器;
與存儲器耦合的處理器;
其中,處理器調用存儲器中存儲的可執行程序代碼,執行如權利要求1-10任一所述的基于RPA及AI的文件存儲方法。
13.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執行時實現如權利要求1-10任一所述的基于RPA及AI的文件存儲方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京來也網絡科技有限公司;北京奔影網絡科技有限公司,未經北京來也網絡科技有限公司;北京奔影網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010612419.8/1.html,轉載請聲明來源鉆瓜專利網。





