[發明專利]一種基于財務流水數據提供實時可視化信息的方法和系統在審
| 申請號: | 201710588804.1 | 申請日: | 2017-07-19 |
| 公開(公告)號: | CN107451911A | 公開(公告)日: | 2017-12-08 |
| 發明(設計)人: | 唐周屹 | 申請(專利權)人: | 唐周屹 |
| 主分類號: | G06Q40/00 | 分類號: | G06Q40/00;G06F17/30 |
| 代理公司: | 廣東前海律師事務所44323 | 代理人: | 張紹波,何凱威 |
| 地址: | 100025 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 財務 流水 數據 提供 實時 可視化 信息 方法 系統 | ||
技術領域
本申請涉及企業數據分析和可視化領域,特別涉及一種基于財務流水數據提供實時可視化信息的方法和系統。
背景技術
現有技術,對企業財務處理中通常試圖通過NLP分詞和機器學習方法處理企業財務流水,形成三張會計報表的解決方案。該處理方式存在如下不足之處,通過輔助記賬入手,在每條記賬數據的基礎上進行NLP分詞等處理,不是大數據的處理方法,目標是節省出納記賬的時間和提高精度;不能有效的處理歷史數據,算法的更新也不能優化已經入庫的數據。
發明內容
本申請的定義企業戰略的實質是企業(實際控制人)和數種類別角色的關系,而這種關系在商業上可以用現金(資本)的往來來描述。本申請從財務流水數據中提煉上述企業戰略并可視化,并且這種可視化是實時的。
為解決上述技術問題:本申請提出一種基于財務流水數據提供實時可視化信息的方法,包括如下步驟:
1)輸入數據操作;
2)將步驟1)中輸入的數據進行處理和驗證;
3)將步驟2)中處理和驗證的數據通過大數據深度學習的方法進行打標簽處理;
4)將步驟3)中打好標簽的數據進行可視化處理。
所述的基于財務流水數據提供實時可視化信息的方法,其中,所述步驟1)中的數據輸入具體包括如下數據輸入方法:(1)數據推送;(2)數據獲取。
所述的基于財務流水數據提供實時可視化信息的方法,其中,所述步驟2)具體包括:
(1)當數據來源為數據推送時,判斷所述數據的類型,所述數據的類型通過判斷后,將多列多表格的數據整理為包含但不僅限于有日期、數字、文本的csv文件,以下稱“數據A”;當所述數據A需要經過數據驗證處理,對日期、數字、文本至少之一的值是否符合范圍、規格以及是否有重復項進行驗證處理,得到符合要求的數據B文件;
(2)當數據來源為數據獲取時,則跳過上述形成數據A的階段,直接進入形成數據B的階段。
所述的基于財務流水數據提供實時可視化信息的方法,其中,所述步驟3)具體包括:將所述數據B文件通過半監督學習或者監督學習的機器學習方式,進行數據打標簽處理,處理好的數據帶有多種不同角色的標簽;
所述數據B打標簽,具體包括:先將文本劃分成分詞,然后用半監督學習或者監督學習的方式進行打標簽,而打標簽的原理是根據句子與標簽的相似性的方式實現的;
所述句子與標簽的相似性的實現方式是將文本劃分成分詞,首先計算出這句話中不同的詞在這個句子中出現的次數,得出一個詞頻向量A,再計算出每個詞對應不同標簽的詞頻,這些詞頻組成了這個文本在不同標簽下的詞頻向量B,有幾個標簽,就有幾個詞頻向量B,計算出詞頻向量A和這些詞頻向量B余弦,值越大就表示越相似,最終選擇最相似的標簽;
為了快速建立標簽詞頻庫,采取句相似的方式批量處理;句相似的實現方式是將文本劃分成分詞,這些分詞組成一個并集,分別計算兩個句子的分詞在這并集里出現的詞頻,這些次數組成一個詞頻向量,計算兩個向量的余弦相似度,值越大就表示越相似。
所述的基于財務流水數據提供實時可視化信息的方法,其中,所述步驟4)具體包括:用可視化圖形的方式,將資產(Asset)、客戶(Client)、伙伴(Partner)、政府(Government)、員工(Employee)、實際控制人(Owner)六種角色的現金往來表達出來,實時反映公司決策。
一種基于財務流水數據提供實時可視化信息的系統,其中,包括:
輸入數據操作模塊,用于進行數據輸入;
數據清洗模塊,用于將輸入數據操作模塊中輸入的數據進行處理和驗證;
打標簽模塊,用于將數據清洗模塊中處理和驗證的數據通過大數據深度學習的方法進行打標簽處理;
數據可視化模塊,用于將打標簽模塊中打好標簽的數據進行可視化處理。
所述的基于財務流水數據提供實時可視化信息的系統,其中,所述輸入數據操作模塊包括:數據推送模塊化、數據獲取模塊至少之一。
所述的基于財務流水數據提供實時可視化信息的系統,其中,所述數據清洗模塊具體包括:數據類型判斷模塊、數據整理模塊、數據驗證模塊三個模塊或者數據類型判斷模塊、數據驗證模塊兩個模塊;
所述數據類型判斷模塊用于判斷當數據來源為數據推送時,判斷所述數據的類型;
所述數據整理模塊用于對所述數據的類型通過判斷后,將多列多表格的數據整理為包含但不限于有日期、數字、文本的csv文件,以下稱“數據A”;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于唐周屹,未經唐周屹許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710588804.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種城市一卡通數據采集系統
- 下一篇:基于大數據的金融客戶管理方法及系統
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





