[發明專利]一種基于稅務數據進行經營預測的方法及裝置在審
| 申請號: | 201610942016.3 | 申請日: | 2016-10-25 |
| 公開(公告)號: | CN107992957A | 公開(公告)日: | 2018-05-04 |
| 發明(設計)人: | 齊超;林文輝 | 申請(專利權)人: | 航天信息股份有限公司 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q40/00 |
| 代理公司: | 北京潤平知識產權代理有限公司11283 | 代理人: | 顧問,肖冰濱 |
| 地址: | 100195 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 稅務 數據 進行 經營 預測 方法 裝置 | ||
技術領域
本發明涉及數據處理領域,具體地,涉及一種基于稅務數據進行經營預測的方法及裝置。
背景技術
隨著稅務數據的不斷增長和互聯網大數據技術的興起,稅務大數據也應運而生。稅務機構基于傳統的系統平臺難以對稅務大數據進行有效處理和信息挖掘,不能充分利用大量的稅務數據進行信息獲取、數據挖掘和數據分析等有價值的操作。
而實際中,稅務數據包含了所有企業的營業情況,能夠真實的反應企業的收入和增長趨勢。因此,稅務機構對稅務數據的大數據處理技術日漸重視,快速有效地利用稅務數據挖掘出有價值的信息越來越重要。
目前,隨著大數據技術的發展和數據計算能力的增強,基于海量數據利用機器學習的智能化處理已成為主流的數據處理方案。但是,現有的機器學習的應用主要集中在有監督學習和無監督學習兩種(具體為分類和聚類),對時間序列則無法準確預測,從而不適用于基于時間序列的稅務數據處理。
發明內容
本發明的目的是提供一種基于稅務數據進行經營預測的方法及裝置,用于實現稅務大數據的有效處理和信息挖掘。
本發明提供了一種基于稅務數據進行經營預測的方法,該方法包括:從目標企業的歷史稅務數據中提取出指定時間段內的稅務記錄,生成歷史稅務記錄序列;以及采用長短期記憶LSTM模型訓練所述歷史稅務記錄序列,預測出目標企業的未來營業數據。
可選地,所述生成歷史稅務記錄序列包括:以預設周期為時間單位對提取出的指定時間段內的稅務記錄按時間順序進行排序;根據排序結果,生成歷史稅務記錄序列;以及對所述歷史稅務記錄序列中的每個元素進行歸一化處理。
可選地,所述歷史稅務記錄序列中的每個元素包括進項總額、銷項總額、總稅額和平均企業人數。
可選地,該方法還包括:訓練并測試LSTM模型。
可選地,所述訓練并測試LSTM模型包括:從目標企業的歷史稅務數據中獲取預定數量的歷史稅務記錄序列樣本;將所述預定數量的歷史稅務記錄序列樣本分別輸入LSTM模型,得到預定數量的預測結果;以及采用預先選定的損失函數處理所述預測結果與企業的實際營業數據;其中,若所述損失函數在訓練過程中收斂,則LSTM的模型訓練結束。
本發明還提供了一種基于稅務數據進行經營預測的裝置,該裝置包括:數據預處理模塊,用于從目標企業的歷史稅務數據中提取出指定時間段內的稅務記錄,生成歷史稅務記錄序列;以及預測模塊,用于采用長短期記憶LSTM模型訓練所述歷史稅務記錄序列,預測出目標企業的未來營業數據。
可選地,所述數據預處理模塊包括:提取子模塊,用于從目標企業的歷史稅務數據中提取出指定時間段內的稅務記錄;排序子模塊,用于以預設周期為時間單位對提取出的指定時間段內的稅務記錄按時間順序進行排序;生成子模塊,用于根據排序結果,生成歷史稅務記錄序列;以及處理子模塊,用于對所述歷史稅務記錄序列中的每個元素進行歸一化處理。
可選地,所述歷史稅務記錄序列中的每個元素包括進項總額、銷項總額、總稅額和平均企業人數。
可選地,該裝置還包括:模型訓練及測試模塊,用于訓練并測試LSTM模型。
可選地,所述模型訓練及測試模塊包括:樣本獲取子模塊,用于從目標企業的歷史稅務數據中獲取預定數量的歷史稅務記錄序列樣本;樣本訓練子模塊,用于將所述預定數量的歷史稅務記錄序列樣本分別輸入LSTM模型,得到預定數量的預測結果;以及損失計算子模塊,用于采用預先選定的損失函數處理所述預測結果與企業的實際營業數據;其中,若通過所述損失計算子模塊獲取的所述損失函數在訓練過程中收斂,則LSTM的模型訓練結束。
本發明的有益效果是:本發明的基于稅務數據進行經營預測的方法及裝置有效利用了預測企業未來時間段內的運營趨勢的LSTM模型,基于模型參數,只需要簡單步驟即可對不同企業未來的營業進行預測,從而為各組織機構提供投資決策或投資依據。
本發明的其它特征和優點將在隨后的具體實施方式部分予以詳細說明。
附圖說明
附圖是用來提供對本發明的進一步理解,并且構成說明書的一部分,與下面的具體實施方式一起用于解釋本發明,但并不構成對本發明的限制。在附圖中:
圖1是本發明實施例所述的基于稅務數據進行經營預測的方法的流程示意圖;
圖2是本發明實施例中生成歷史稅務記錄序列的方法的流程示意圖;
圖3是本發明實施例中訓練并測試LSTM模型的流程示意圖;
圖4(a)是本發明實施例中的LSTM模型的單元結構的示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于航天信息股份有限公司,未經航天信息股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610942016.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種陣列基板、柔性顯示裝置
- 下一篇:陣列基板、顯示面板和顯示裝置
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





