[發明專利]多源數據庫關聯的審計方法及系統在審
| 申請號: | 201810997657.8 | 申請日: | 2018-08-29 |
| 公開(公告)號: | CN109033457A | 公開(公告)日: | 2018-12-18 |
| 發明(設計)人: | 段勇 | 申請(專利權)人: | 廣州中贏財富信息科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京冠和權律師事務所 11399 | 代理人: | 李建華 |
| 地址: | 510620 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 映射 文本 數據庫 關聯 多源 存儲 分層體系結構 管理成本 軟件項目 審計系統 業務對象 直接訪問 持久化 數據源 可控 審計 升級 維護 | ||
1.一種多源數據庫關聯的審計方法,包括存儲于第一數據庫的若干離散文本和存儲于第二數據庫若干映射本文,人員多次將不同的一個離散文本與一個或多個映射文本相關聯,其特征是,包括以下步驟:
接收人員多次將不同的一個離散文本與一個或多個映射文本相關聯的數據,并分別獲取離散文本和映射文本;
對所述離散文本和映射文本通過第一策略計算相似度,輸出與該離散文本相似度低于第一預設值的映射文本;
接收一個隨機文本,對所述隨機文本和離散文本通過第二策略計算相似度,將與隨機文本相似度高于第二預設值的離散文本所關聯的映射文本輸出。
2.根據權利要求1所述的審計方法,其特征是,
在所述接收一個隨機文本,對所述隨機文本和離散文本通過第二策略計算相似度,將與隨機文本相似度高于第二預設值的離散文本所關聯的映射文本輸出的步驟后,還包括:
獲取每一個映射文本,通過第三策略計算每兩個映射文本的相似度,將相似度高于第三預設值的兩個映射文本分別輸出;
將所有映射文本兩兩之間的相似度都低于第三預設值的映射文本進行統計為映射表單并存儲于第一數據庫。
3.根據權利要求2所述的審計方法,其特征是,
在所述將所有映射文本兩兩之間的相似度都低于第三預設值的映射文本進行統計為映射表單并存儲于第一數據庫的步驟后,還包括:
將與映射文本相似度高于第一預設值的離散文本,與映射文本一一關聯映射;
將與離散文本相似度高于第二預設值的隨機文本,與離散文本關聯的映射文本一一關聯映射。
4.根據權利要求2所述的方法,其特征是,
所述第一策略、第二策略以及第三策略為相同策略。
5.根據權利要求4所述的方法,其特征是,
所述的對所述離散文本和映射文本通過第一策略計算相似度包括:
獲取第一數據庫內存有的若干離散文本Ai,離散文本Ai的集合為θ1=(A1,A2,L,Ai,L,An),Ai表示其中第i個離散文本,n為離散文本的數量;
所述第二數據庫預先錄入的若干映射文本的集合為θ2=(B1,B2,L,Bj,L,Bm),Bj表示其中第j個映射文本,m為映射文本的數量;
按照以下公式,分別計算每個離散文本Ai與映射文本Bj的相似度:
其中,Ai表示當前計算的第i個離散文本,Bj表示其中第j個映射文本;|Ai∩Bj|表示離散文本Ai與映射文本Bj之間相同字符數,|Ai∪Bj|表示離散文本Ai與映射文本Bj的所有字符數;
確定滿足以下條件的映射文本Bj,將滿足所述條件的映射文本Bj作為有效映射文本Bm,
所述條件為:
Jδ(A,Bi)p≤|Jδ(Ai,Bj)|≤k;
確定所述有效映射文本Bm的綜合相似度Jm,且:
其中,p為相似度的預設最小臨界值,k為相似度的預設最大臨界值,Qm為有效映射文本Bm的歷史映射次數;c為相似度Jδ(Ai,Bm)的權重系數;d為Qm的權重系數;Q0為Qm的預設臨界值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州中贏財富信息科技有限公司,未經廣州中贏財富信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810997657.8/1.html,轉載請聲明來源鉆瓜專利網。





