[發明專利]一種識別非法單據的方法以及識別裝置有效
| 申請號: | 201811094734.5 | 申請日: | 2018-09-19 |
| 公開(公告)號: | CN109325102B | 公開(公告)日: | 2021-02-19 |
| 發明(設計)人: | 張國銳 | 申請(專利權)人: | 金蝶軟件(中國)有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/338;G06Q40/00 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518057 廣東省深圳市南山區*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 識別 非法 單據 方法 以及 裝置 | ||
1.一種識別非法單據的方法,其特征在于,包括:
根據歷史單據數據確定目標字段對應的異常值;
獲取目標單據,所述目標單據包括所述目標字段;
判斷所述目標字段在所述目標單據中對應的值與所述異常值是否匹配;
若匹配,則提示所述目標單據為非法單據;
根據歷史單據數據確定目標字段對應的異常值,包括:
劃分歷史單據數據中所述目標字段對應的值為N個數據組,所述N為正整數;
計算每個數據組對應的異常占比以及所述N個數據組對應的平均占比,所述異常占比通過異常單據數量和單據總數計算得到,所述單據總數為目標字段的值屬于所述數據組的所有單據的數量,所述異常單據數量為所述所有單據中非法單據的數量;
將所述異常占比與所述平均占比的差值大于預設閾值的數據組確定為目標數據組,并將所述目標數據組中的值確定為所述目標字段的異常值。
2.根據權利要求1所述的方法,其特征在于,所述目標字段包括名稱字段,劃分歷史單據數據中所述目標字段對應的值為N個數據組,包括:
劃分所述名稱字段對應的每一個名稱為一個數據組,所述名稱的數量和為N;
對應地,在將所述目標數據組中的值確定為所述目標字段的異常值之后,判斷所述目標字段在所述目標單據中對應的值與所述異常值是否匹配,包括:
獲取所述名稱字段在所述目標單據中對應的名稱;
判斷所述獲取的所述名稱是否與所述名稱字段的異常值相同;
若是,則提示所述目標單據為非法單據。
3.根據權利要求1所述的方法,其特征在于,所述目標字段包括數值字段,劃分歷史單據數據中所述目標字段對應的值為N個數據組,包括:
排列所述數值字段對應的數值;
劃分排列后的數值為N個等距的區間,每一所述劃分后的數值一一對應于所述區間中;
確定所述N個等距的區間為所述N個數據組;
對應地,在將所述目標數據組中的值確定為所述目標字段的異常值之后,判斷所述目標字段在所述目標單據中對應的值與所述異常值是否匹配,包括:
獲取所述數值字段在所述目標單據中對應的數值;
判斷所述獲取的所述數值是否落入所述目標數據組內;
若是,則提示所述目標單據為非法單據。
4.根據權利要求1所述的方法,其特征在于,所述目標字段包括相似字段,劃分歷史單據數據中所述目標字段對應的值為N個數據組,包括:
確定所述相似字段中詞意相近的詞語為同類詞,所述同類詞是結合語句解析軟件與詞庫得到的;
統計類范圍的個數和,所述類范圍的個數和為N,所述類范圍是把每一類同類詞確定為一個類范圍;
確定所述N個類范圍為所述N個數據組;
對應地,在將所述目標數據組中的值確定為所述目標字段的異常值之后,判斷所述目標字段在所述目標單據中對應的值與所述異常值是否匹配,包括:
獲取所述相似字段在所述目標單據中對應的詞語;
判斷所述獲取的所述詞語是否落入所述目標數據組內;
若是,則提示所述目標單據為非法單據。
5.根據權利要求1所述的方法,其特征在于,在根據歷史單據數據確定目標字段對應的異常值之前,還包括:
獲取范圍表,所述范圍表包括第一表、第二表以及第三表;
設置第一關聯關系和第二關聯關系,所述第一關聯關系是所述第一表中的外鍵與所述第二表中的主鍵之間的關聯關系,所述第二關聯關系是所述第二表中的外鍵與所述第三表中的主鍵之間的關聯關系,所述第一表中的外鍵為所述第二表中的主鍵,所述第二表中的外鍵為所述第三表中的主鍵,所述第一關聯關系和所述第二關聯關系是用于獲取所述歷史單據數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于金蝶軟件(中國)有限公司,未經金蝶軟件(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811094734.5/1.html,轉載請聲明來源鉆瓜專利網。





