[發(fā)明專利]一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 201911117051.1 | 申請日: | 2019-11-15 |
| 公開(公告)號(hào): | CN110955763A | 公開(公告)日: | 2020-04-03 |
| 發(fā)明(設(shè)計(jì))人: | 王桂欽;彭澎;陳威;王偉;劉伊雅 | 申請(專利權(quán))人: | 深圳供電局有限公司 |
| 主分類號(hào): | G06F16/332 | 分類號(hào): | G06F16/332;G06Q50/18 |
| 代理公司: | 廣州嘉權(quán)專利商標(biāo)事務(wù)所有限公司 44205 | 代理人: | 蔡偉杰 |
| 地址: | 510080 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 審計(jì) 風(fēng)險(xiǎn) 數(shù)據(jù) 搜索 方法 系統(tǒng) | ||
1.一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索方法,其特征在于,所述方法包括以下步驟:
步驟1,接收用戶的檢索式;
步驟2,提取檢索式中關(guān)鍵詞;
步驟3,計(jì)算關(guān)鍵詞與審計(jì)風(fēng)險(xiǎn)庫中的各個(gè)文本數(shù)據(jù)的近似度;
步驟4,根據(jù)各個(gè)文本數(shù)據(jù)的近似度讀取審計(jì)風(fēng)險(xiǎn)庫中近似度最大的N個(gè)文本數(shù)據(jù);
步驟5,將近似度最大的N個(gè)文本數(shù)據(jù)作為檢索結(jié)果輸出到用戶。
2.根據(jù)權(quán)利要求1所述的一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索方法,其特征在于,在步驟1中,所述檢索式包括檢索詞、邏輯算符、通配符,檢索式以句子為單位。
3.根據(jù)權(quán)利要求1所述的一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索方法,其特征在于,在步驟2中,提取關(guān)鍵詞的方法為TF-IDF、TextRank、LSA/LSI/LDA中任意一種關(guān)鍵詞提取方法。
4.根據(jù)權(quán)利要求1所述的一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索方法,其特征在于,在步驟3中,計(jì)算關(guān)鍵詞與審計(jì)風(fēng)險(xiǎn)庫中的各個(gè)文本數(shù)據(jù)的近似度的方法包括以下步驟:
步驟3.1,計(jì)算關(guān)鍵詞的交叉熵值:令關(guān)鍵詞為先驗(yàn)條件W,審計(jì)風(fēng)險(xiǎn)庫的每個(gè)類別中的各個(gè)關(guān)鍵詞W與類別Ci,類別為文本數(shù)據(jù)類別,關(guān)鍵詞W的期望交叉熵為:
其中,p(Ci)表示屬于類別Ci的審計(jì)風(fēng)險(xiǎn)庫中的各個(gè)文本數(shù)據(jù)占所有消息數(shù)目的比重,p(W)表示包含關(guān)鍵詞W的文本數(shù)據(jù)占所有文本數(shù)據(jù)數(shù)目的比重,p(Ci|W)表示在包含關(guān)鍵詞W的消息中屬于類別Ci的消息所占的比重,n為審計(jì)風(fēng)險(xiǎn)庫中文本數(shù)據(jù)類別的總數(shù)量;
步驟3.2,計(jì)算卡方值:在檢索式與審計(jì)風(fēng)險(xiǎn)庫中由關(guān)鍵詞和審計(jì)風(fēng)險(xiǎn)庫中的文本數(shù)據(jù)出現(xiàn)關(guān)鍵詞的頻數(shù)構(gòu)成卡方頻數(shù)矩陣,令Or,c表示檢索式在審計(jì)風(fēng)險(xiǎn)庫中出現(xiàn)的卡方頻數(shù)矩陣中第r行第c列的值,第r行的和記為nr,第c列的和記為nc,所有元素的和記為n,計(jì)算矩陣中的每一個(gè)元素的期望值Er,c,
其中,消息包括檢索式與審計(jì)風(fēng)險(xiǎn)庫中的文本數(shù)據(jù);
步驟3.3,計(jì)算檢索式與審計(jì)風(fēng)險(xiǎn)庫中的各文本數(shù)據(jù)的近似度Si:
其中TFi是交叉熵值大于交叉閾值的消息i中出現(xiàn)的次數(shù),DFi是卡方值χ2大于卡方閾值的消息i中出現(xiàn)的次數(shù),i取值范圍為1到N,N是審計(jì)風(fēng)險(xiǎn)庫中所有消息的總數(shù)。
5.根據(jù)權(quán)利要求4所述的一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索方法,其特征在于,在步驟3中,審計(jì)風(fēng)險(xiǎn)庫包括數(shù)據(jù)庫數(shù)據(jù)和文本數(shù)據(jù),數(shù)據(jù)庫數(shù)據(jù)是經(jīng)過篩選處理的結(jié)構(gòu)化數(shù)據(jù),文本數(shù)據(jù)類別包括問題基本數(shù)據(jù)類別、法律法規(guī)數(shù)據(jù)類別、審計(jì)意見或建議類別、責(zé)任及整改情況數(shù)據(jù)類別、審計(jì)方法數(shù)據(jù)類別、審計(jì)項(xiàng)目數(shù)據(jù)類別。
6.根據(jù)權(quán)利要求5所述的一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索方法,其特征在于,在步驟3中,問題基本數(shù)據(jù)類別包括:業(yè)務(wù)領(lǐng)域、管理環(huán)節(jié)、問題名稱、關(guān)鍵詞、問題及表現(xiàn)形式、問題成因、問題后果、風(fēng)險(xiǎn)等級(jí);法律法規(guī)數(shù)據(jù)類別包括:法律制度名稱、法規(guī)制度條款依據(jù)、文號(hào)、發(fā)文單位、發(fā)文年份、生效日期、作廢日期;審計(jì)意見或建議類包括:審計(jì)意見或建議;責(zé)任及整改情況數(shù)據(jù)類別包括:責(zé)任部門、涉及部門、整改措施;審計(jì)方法數(shù)據(jù)類別包括:審計(jì)方法、審計(jì)程序、所需審計(jì)資料、工作底稿;審計(jì)項(xiàng)目數(shù)據(jù)類別包括:專項(xiàng)審計(jì)、經(jīng)濟(jì)責(zé)任審計(jì)、經(jīng)營管理審計(jì)、工程審計(jì)、營銷審計(jì)、審計(jì)調(diào)查、竣工決算審計(jì)。
7.根據(jù)權(quán)利要求6所述的一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索方法,其特征在于,在步驟5中,檢索結(jié)果為近似度最大的N個(gè)文本數(shù)據(jù)按照近似度的大小進(jìn)行降序排列。
8.一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索系統(tǒng),其特征在于,所述系統(tǒng)包括:存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器中并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序運(yùn)行在以下系統(tǒng)的單元中:
檢索式讀取單元,用于接收用戶的檢索式;
關(guān)鍵詞提取單元,用于提取檢索式中關(guān)鍵詞;
近似度計(jì)算單元,用于計(jì)算關(guān)鍵詞與審計(jì)風(fēng)險(xiǎn)庫中的各個(gè)文本數(shù)據(jù)的近似度;
風(fēng)險(xiǎn)庫讀取單元,用于根據(jù)各個(gè)文本數(shù)據(jù)的近似度讀取審計(jì)風(fēng)險(xiǎn)庫中近似度最大的N個(gè)文本數(shù)據(jù);
結(jié)果輸出單元,用于將近似度最大的N個(gè)文本數(shù)據(jù)作為檢索結(jié)果輸出到用戶。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳供電局有限公司,未經(jīng)深圳供電局有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911117051.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 風(fēng)險(xiǎn)監(jiān)視裝置、風(fēng)險(xiǎn)監(jiān)視系統(tǒng)、風(fēng)險(xiǎn)監(jiān)視方法
- 風(fēng)險(xiǎn)控制方法及風(fēng)險(xiǎn)控制裝置
- 風(fēng)險(xiǎn)分層
- 風(fēng)險(xiǎn)分層
- 風(fēng)險(xiǎn)判定裝置、風(fēng)險(xiǎn)判定方法以及風(fēng)險(xiǎn)判定程序
- 風(fēng)險(xiǎn)評(píng)價(jià)系統(tǒng)以及風(fēng)險(xiǎn)評(píng)價(jià)方法
- 風(fēng)險(xiǎn)管理裝置、風(fēng)險(xiǎn)管理方法以及風(fēng)險(xiǎn)管理程序
- 風(fēng)險(xiǎn)測算方法和風(fēng)險(xiǎn)測算系統(tǒng)
- 風(fēng)險(xiǎn)評(píng)估方法及風(fēng)險(xiǎn)評(píng)估裝置
- 風(fēng)險(xiǎn)評(píng)估方法及風(fēng)險(xiǎn)評(píng)估裝置
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





