[發明專利]一種大數據平臺系統有效
| 申請號: | 202210019074.4 | 申請日: | 2022-01-10 |
| 公開(公告)號: | CN114547404B | 公開(公告)日: | 2023-02-17 |
| 發明(設計)人: | 孟竹;王普昕 | 申請(專利權)人: | 普瑞純證醫療科技(蘇州)有限公司 |
| 主分類號: | G06F16/906 | 分類號: | G06F16/906;G06F16/903;G06F16/28;G06F16/25;G06F16/2458 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 鐘文瀚 |
| 地址: | 215100 江蘇省蘇州*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據 平臺 系統 | ||
1.一種大數據平臺系統,其特征在于,包括:數據獲取模塊、數據處理模塊、數據預處理模塊以及數據展示模塊,所述數據獲取模塊與所述數據處理模塊連接,所述數據處理模塊與所述數據展示模塊連接;
所述數據獲取模塊用于獲取、解析、更新和寫入存儲公司名稱數據,并傳輸至所述數據處理模塊;
所述數據處理模塊接收到所述公司名數據并與歷史存儲的公司名數據進行匹配形成含映射關系的公司名數據;
所述數據處理模塊將所述含映射關系的公司名數據傳輸至所述數據展示模塊中以便外部程序調用;
數據處理模塊包括數據匹配模塊,數據匹配模塊用于接收經所述數據預處理模塊處理的數據,并采用模糊字符串匹配的方式進行數據匹配;數據匹配模塊包括聚類模塊、名稱標準化模塊和置信度模塊,所述名稱標準化模塊與所述聚類模塊連接,所述置信度模塊與所述名稱標準化模塊連接;所述聚類模塊用于將屬于同一家公司的不同公司名稱歸類;所述名稱標準化模塊用于接收所述聚類模塊的歸類數據,并對每一類數據中提取最長的公共子串作為當前類的標準名稱,獲取名稱標準的公司名數據;所述置信度模塊用于將所述名稱標準的公司名數據與歷史存儲的公司名數據進行匹配形成含映射關系的公司名數據。
2.根據權利要求1所述的大數據平臺系統,其特征在于,所述數據獲取模塊包括請求模塊、解析模塊、更新模塊和寫入存儲模塊;
所述請求模塊和所述解析模塊連接,所述解析模塊和所述更新模塊連接,所述更新模塊和所述寫入存儲模塊連接;
所述請求模塊用于根據不同的數據源網站編寫對應的數據源獲取邏輯,并獲取公司名稱源數據;
所述解析模塊接收所述公司名稱源數據并生成表單,并將所述表單傳輸至所述更新模塊,所述更新模塊用于將所述表單中的內容與歷史存儲的數據進行匹配,生成歷史記錄文件數據、增量文件數據和全量文件數據;
所述寫入存儲模塊用于存儲所述歷史記錄文件數據、所述增量文件數據和所述全量文件數據。
3.根據權利要求2所述的大數據平臺系統,其特征在于,所述數據處理模塊還包括數據下載模塊和格式轉化模塊,所述數據下載模塊與所述格式轉化模塊連接;
所述數據下載模塊用于下載所述寫入存儲模塊中的所述增量文件數據;
所述格式轉化模塊用于將所述增量文件數據采用神經語言程序學和模糊邏輯技術進行格式轉換。
4.根據權利要求3所述的大數據平臺系統,其特征在于,所述數據預處理模塊與所述格式轉化模塊連接,所述數據預處理模塊用于刪除所述增量文件數據中的公司名數據的特殊字符、額外空格、包含非英文字符的字符串,還用于將所述公司名數據中的大寫字母轉換為小寫。
5.根據權利要求2所述的大數據平臺系統,其特征在于,所述數據展示模塊包括數據存儲模塊和數據調用接口模塊,所述數據存儲模塊與所述置信度模塊連接,用于將所述含映射關系的公司名數據進行存儲,所述數據調用接口模塊用于提供外部程序調用接口。
6.根據權利要求5所述的大數據平臺系統,其特征在于,所述數據調用接口模塊還與所述寫入存儲模塊連接,用于調用所述寫入存儲模塊存儲的所述歷史記錄文件數據、所述增量文件數據和所述全量文件數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于普瑞純證醫療科技(蘇州)有限公司,未經普瑞純證醫療科技(蘇州)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210019074.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種斷路器監控系統
- 下一篇:智能文檔編輯的管理系統、方法、設備及存儲介質
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





