[發(fā)明專利]基于RPA及AI的文件存儲方法、裝置、設備和介質(zhì)在審
| 申請?zhí)枺?/td> | 202010612419.8 | 申請日: | 2020-06-30 |
| 公開(公告)號: | CN111752900A | 公開(公告)日: | 2020-10-09 |
| 發(fā)明(設計)人: | 汪冠春;胡一川;褚瑞;李瑋;潘庚生;翁嘉頎 | 申請(專利權)人: | 北京來也網(wǎng)絡科技有限公司;北京奔影網(wǎng)絡科技有限公司 |
| 主分類號: | G06F16/16 | 分類號: | G06F16/16;G06F16/13;G06F16/11;G06F16/174;G06F16/35;G06K9/34 |
| 代理公司: | 北京科領智誠知識產(chǎn)權代理事務所(普通合伙) 11782 | 代理人: | 陳士騫 |
| 地址: | 100080 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 rpa ai 文件 存儲 方法 裝置 設備 介質(zhì) | ||
本發(fā)明實施例公開了一種基于RPA及AI的文件存儲方法、裝置、設備和介質(zhì),該方法包括:S1、遍歷設定文件夾中未進行分類的文件數(shù)據(jù);S2、將所述文件數(shù)據(jù)進行分類;S3、將所述文件數(shù)據(jù)依據(jù)分類結果進行存儲。本發(fā)明通過遍歷設定文件夾中未進行分類的文件數(shù)據(jù),將該文件數(shù)據(jù)進行分類,并按照分類結果進行存儲,實現(xiàn)了采用自動化的方式對文件的掃描、分類和上傳操作,解決了現(xiàn)有技術中由于工作人員人工操作費時費力的問題,提升了文件的管理效率。
技術領域
本發(fā)明涉及文件管理技術領域,具體涉及一種基于RPA及AI的文件存儲方法、裝置、設備和介質(zhì)。
背景技術
RPA(Robotic process automation,機器人流程自動化),即通過特定的“機器人軟件”,模擬人在計算機上的操作,按規(guī)則自動執(zhí)行流程任務。RPA的具有獨特的優(yōu)勢:低代碼、非侵入。低代碼是說,RPA不需要很高的IT水平就能操作,不懂編程的業(yè)務人員也能開發(fā)流程;非侵入是說,RPA可以模擬人的操作,不用軟件系統(tǒng)開放接口。但是傳統(tǒng)的RPA具有一定的局限性:只能基于固定的規(guī)則,并且應用場景受限。隨著AI(ArtificialIntelligence,人工智能)技術的不斷發(fā)展,RPA與AI深度融合克服了傳統(tǒng)RPA的局限,RPA及AI=Hand work+Head work,正在極大的改變勞動力的價值。
RPA在處理任務的過程中,可能會應用到自然語言處理(Natural LanguageProcessing,NLP)和光學字符識別(Optical Character Recognition,OCR)技術。其中,NLP是人工智能的一個子領域,可用于文本內(nèi)容的理解和分類。OCR是指電子設備,例如掃描儀或數(shù)碼相機,檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字的過程。
目前,NLP和OCR技術的應用一般是針對電子文件。在公司或者行政機構運營過程中,一般都會涉及到大批量的紙質(zhì)文件。而將紙質(zhì)存檔掃描成電子文件并進行歸檔,是辦公過程中必不可少的環(huán)節(jié)。但是,實際情況是,由于紙質(zhì)文件數(shù)量較多,人工對紙質(zhì)文件進行整理順序、掃描、分類和上傳,然后將紙質(zhì)文件裝訂歸檔這一工作流程相當繁瑣,費時費力。
發(fā)明內(nèi)容
本發(fā)明實施例公開一種基于RPA及AI的文件存儲方法、裝置、設備和介質(zhì),實現(xiàn)了文件的自動分類和歸檔,提升了文件的管理效率。
第一方面,本發(fā)明實施例公開了一種基于RPA及AI的文件存儲方法,該方法包括:
S1、遍歷設定文件夾中未進行分類的文件數(shù)據(jù);
S2、將所述文件數(shù)據(jù)進行分類;
S3、將所述文件數(shù)據(jù)依據(jù)分類結果進行存儲。
可選的,所述步驟S2具體包括:
S21、將所述文件數(shù)據(jù)依據(jù)文件內(nèi)容進行分類。
可選的,所述步驟S21具體包括:
S211、根據(jù)所述文件數(shù)據(jù)的文件類型生成目錄樹;
S212、將所述目錄樹中的各文件數(shù)據(jù)依據(jù)文件內(nèi)容進行分類。
可選的,所述步驟S212具體包括:
S2121、基于光學字符識別OCR方法,對所述目錄樹中各文件數(shù)據(jù)的文件內(nèi)容進行識別;
S2122、將各文件數(shù)據(jù)依據(jù)識別結果進行分類。
可選的,所述步驟S2121具體包括:
分別調(diào)用本地和云端的OCR軟件,識別所述目錄樹中各文件數(shù)據(jù)的文件內(nèi)容,得到本地識別結果和云端識別結果;
從所述本地識別結果和所述云端識別結果中,選擇置信度高的識別結果作為所述文件內(nèi)容的識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京來也網(wǎng)絡科技有限公司;北京奔影網(wǎng)絡科技有限公司,未經(jīng)北京來也網(wǎng)絡科技有限公司;北京奔影網(wǎng)絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010612419.8/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





