[發明專利]一種基于機器人的智能數據采集系統有效
| 申請號: | 202210011870.3 | 申請日: | 2022-01-07 |
| 公開(公告)號: | CN114078254B | 公開(公告)日: | 2022-04-29 |
| 發明(設計)人: | 劉波;張曉瑋;戈姍姍;曾紹穎;李浩;李偉利 | 申請(專利權)人: | 華中科技大學同濟醫學院附屬協和醫院 |
| 主分類號: | G06V30/413 | 分類號: | G06V30/413;G06V30/19;G06K9/62 |
| 代理公司: | 北京中譽至誠知識產權代理事務所(普通合伙) 11858 | 代理人: | 張平力 |
| 地址: | 430022 湖北*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 機器人 智能 數據 采集 系統 | ||
本發明涉及數據采集領域,尤其涉及一種基于機器人的智能數據采集系統,包括:采集模塊,用以提取文件內的特征信息,中控模塊,用以對所述采集模塊提取的特征信息進行識別并在識別完成時檢測針對特征信息的識別精度,云端服務器,其中存儲有語言文字信息,本發明通過設有采集模塊、中控模塊及云端服務器,用以根據用戶的需求提取文件中的特征信息生成暫存文檔,并對暫存文檔中的文字內容進行校驗替換,保證了紙質文件電子化的準確性,同時本發明通過采用云端服務器中存儲的文字特征以對文字內容中含義不清楚的字詞及導致句子有歧義的字詞進行校驗替換,在進一步保證數據采集系統采集內容的精確度的同時,提高了本發明所述系統的運行效率。
技術領域
本發明涉及數據采集技術領域,尤其涉及一種基于機器人的智能數據采集系統。
背景技術
現今,將紙質文件電子化的技術已越發成熟,但是社會上的現有技術仍存在固定比率的紙質數據誤讀的問題,且現有技術大都不對紙質文件電子化的數據進行校驗,進一步加劇數據誤讀問題的產生。
中國專利公開號CN105681620B公開了一種圖像文字采集一體化系統,包括:服務器模塊、初始化配置模塊、掃描模塊和上傳信息反饋模塊,所述初始化配置模塊包括圖片文件夾路徑輸入模塊、表格名稱輸入模塊和文件名輸入模塊,所述掃描模塊包括掃描控件模塊、掃描操作模塊和掃描文件編輯模塊。通過上述方式,本發明圖像文字采集一體化系統,不僅可以完成圖像文字的掃描采集工作,而且可以直接將采集的各種信息分門別類的排列組合在相對應的表格中,提高了工作效率和準確率。
由此可見,上述技術方案存在以下問題:
1、沒有對識別的文字信息進行詞義與句子的校驗造成系統讀取精度低的問題;
2、未對內容信息進行分類并應用各自的采集方法。
發明內容
為此,本發明提供一種基于機器人的智能數據采集系統,用以克服現有技術中沒有對識別的文字信息進行詞義與句子的校驗造成系統讀取精度低的問題。
為實現上述目的,本發明提供一種基于機器人的智能數據采集系統,包括:
采集模塊,用以提取文件內的特征信息、根據文件內特征信息生成對應的暫存文檔、對暫存文檔中的各特征信息的種類進行判定并在判定完成時根據用戶需求對對應種類的特征信息進行初步采集;當所述采集模塊識別到文件時,采集模塊根據需求提取暫存文檔中對應種類的特征信息;所述特征信息的種類包括文字特征、圖像特征以及表格特征;
中控模塊,其與所述采集模塊相連,用以對所述采集模塊提取的特征信息進行識別并在識別完成時檢測針對特征信息的識別精度;當所述中控模塊針對文件中的文字特征進行識別時,中控模塊依次對各文字進行識別,當中控模塊完成對全部文字特征的識別時,中控模塊檢測文字特征中存在的詞語和語句并依次對詞語和語句的識別精度進行校對,若存在單個詞語,該詞語的含義不清楚,中控模塊依次重新識別該詞語中的各文字以重新識別單個首選替換詞和若干備選替換詞,若不存在含義不清楚的詞語,中控模塊針對文字特征中的語句的識別精度進行校對并在判定存在含義不清楚的語句時逐個重新識別語句中的各詞語;
云端服務器,其與所述中控模塊相連,在云端服務器中存儲有若干不同種類的預設特征信息,用以在中控模塊對特征進行識別時提供對應種類的預設特征信息作為識別標準;當所述中控模塊針對對應種類的特征信息進行識別時,中控模塊從所述云端服務器中提取對應種類的預設特征信息并使用該預設特征信息作為針對對應種類的特征信息的識別標準。
進一步地,所述中控模塊中設有預設文字特征相似度S0,當所述中控模塊針對文件中的文字特征進行識別時,中控模塊從所述云端服務器中提取預設文字特征以作為識別標準,提取完成后,中控模塊使用預設文字特征依次對所述采集模塊初步采集的各文字特征進行識別,針對單個所述文字特征,中控模塊依次計算該文字特征與各預設文字特征的相似度,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華中科技大學同濟醫學院附屬協和醫院,未經華中科技大學同濟醫學院附屬協和醫院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210011870.3/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





