[發明專利]提升審計精度的方法及系統在審
申請號: | 202011103618.2 | 申請日: | 2020-10-15 |
公開(公告)號: | CN112241512A | 公開(公告)日: | 2021-01-19 |
發明(設計)人: | 王洪賀;孫永強 | 申請(專利權)人: | 四川長虹電器股份有限公司 |
主分類號: | G06F17/18 | 分類號: | G06F17/18 |
代理公司: | 成都虹橋專利事務所(普通合伙) 51124 | 代理人: | 吳中偉 |
地址: | 621000 四*** | 國省代碼: | 四川;51 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 提升 審計 精度 方法 系統 | ||
本發明涉及數據審計領域,具體涉及一種提升審計精度的方法及系統,解決了設計數據中出現的偏差,極大地提高了審計精度。提升審計精度的方法,包括:對數據進行預處理,確定審計數據;對審計數據運用格拉布斯檢驗法剔除異常值,進行數據清洗;根據清洗之后的數據建立正態分布模型并進行仿真;在仿真過程中,引入偏度以及峰度模型修正正態分布模型提升審計精度。本發明適用于提升審計精度。
技術領域
本發明涉及數據審計領域,具體涉及一種提升審計精度的方法及系統。
背景技術
在審計領域數據的錄入的過程中,由于各種因素導致錄數據可能出現異常,一般數據都是由業務人員憑借人工進行統計,簡單分析,沒有系統的數據分析方法。審計領域中現有的數據分析方法是依靠審計人員的經驗進行人工檢測,效率比較低下。而在其他有類似需求的領域,則是基于統計法的檢驗方法,但是由于審計領域的數據量非常大,首先需要根據需求對大量的數據進行分組,然后再對每組數據進行分析,而其他領域的分析方法并未考慮到審計領域的數據特征,所以難以應用在審計領域中。因此,引入機器學習針對審計系統進行數據分析,可以合理高效的利用審計系統數據,提煉有價值數據,增強審計系統時效性成為時代的主流。
在機器學習的眾多算法中,統計分析是最基本的算法,包含許多重要的模型,為其他機器學習算法提供訓練樣本等,其中概率分布模型是統計分析中最重要的組成部分,正態分布又名高斯分布,是一個在數學、物理及工程等領域都非常重要的概率分布,若隨機變量服從一個位置參數、尺度參數為的概率分布,記為:則其概率密度函數為正態分布的數學期望值或期望值等于位置參數,決定了分布的位置;其方差的開平方或標準差等于尺度參數,決定了分布的幅度。正態分布的概率密度函數曲線呈鐘形,因此又經常稱之為鐘形曲線。
審計系統采購信息記錄物料價格是連續型變量,故排除離散型分布;經過基本的統計分析以及對業務場景的了解,判定同一物料的大部分采購信息價格處在均值附近,存在少量異常值,故排除均勻分布和指數分布。
正態分布是許多統計方法的理論基礎。檢驗、方差分析、相關和回歸分析等多種統計方法均要求分析的指標服從正態分布。許多統計方法雖然不要求分析指標服從正態分布,但相應的統計量在大樣本時近似正態分布,因而大樣本時這些統計推斷方法也是以正態分布為理論基礎的。
現有數據審計,僅僅依賴正態分布模型,只經過正態分布模型處理的數據,往往存在偏差,因此導致審計精度不高,圖3為現有審計精度指標圖,從圖中看出其審計精度存在大量離散點。
發明內容
本發明的目的是提供一種提升審計精度的方法及系統,解決了設計數據中出現的偏差,極大地提高了審計精度。
本發明采取如下技術方案實現上述目的,提升審計精度的方法,包括:
步驟(1)、對數據進行預處理,確定審計數據;
步驟(2)、對審計數據運用格拉布斯檢驗法剔除異常值,進行數據清洗;
步驟(3)、根據清洗之后的數據建立正態分布模型并進行仿真;
步驟(4)、在仿真過程中,引入偏度以及峰度模型修正正態分布模型提升審計精度。
進一步的是,在步驟(2)中,異常值包括:人工錄入的異常數據以及審計系統存在的異常數據。
進一步的是,在步驟(2)中,運用格拉布斯檢驗法剔除異常值的具體方法包括:
21、對原始審計數據進行異常值剔除以及異常離散值剔除;
22、剔除異常值及異常離散值后,確定審計數據中的最大值和最小值;
23、將最大值及最小值與審計數據均值差值最大的的值作為可疑值;
24、運用格拉布斯模型剔除可疑值,并進行二次格拉布斯模型異常值剔除。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川長虹電器股份有限公司,未經四川長虹電器股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011103618.2/2.html,轉載請聲明來源鉆瓜專利網。