[發(fā)明專利]一種基于摘要方式的機(jī)器輔助閱讀審計(jì)方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 201810142416.5 | 申請日: | 2018-02-11 |
| 公開(公告)號: | CN110162765A | 公開(公告)日: | 2019-08-23 |
| 發(fā)明(設(shè)計(jì))人: | 韓中華;姜偉;徐福海;吳雪軍 | 申請(專利權(quán))人: | 鼎復(fù)數(shù)據(jù)科技(北京)有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 北京康思博達(dá)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11426 | 代理人: | 范國鋒;劉冬梅 |
| 地址: | 100020 北京*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 審計(jì) 抽取 功能區(qū)塊 機(jī)器輔助 類別標(biāo)簽 摘要方式 摘要內(nèi)容 審閱 解析 分類內(nèi)容 機(jī)器模型 審計(jì)成本 數(shù)據(jù)內(nèi)容 文本內(nèi)容 原文內(nèi)容 原文信息 閱讀 錄入 標(biāo)注 原文 文本 修正 輸出 合并 分類 幫助 | ||
本發(fā)明公開了一種基于摘要方式的機(jī)器輔助閱讀審計(jì)方法及系統(tǒng),其實(shí)現(xiàn)過程為:錄入文本,并完成數(shù)據(jù)內(nèi)容及格式的解析;對解析后文本內(nèi)容進(jìn)行分類,將相同分類內(nèi)容進(jìn)行聚合并標(biāo)注類別標(biāo)簽,形成帶類別標(biāo)簽的功能區(qū)塊;抽取各功能區(qū)塊中相應(yīng)的摘要內(nèi)容;輸出摘要內(nèi)容,結(jié)合審閱人員的意見,形成審閱結(jié)果。通過機(jī)器模型,預(yù)先抽取原文摘要,并輔助以摘要的原文信息,可以有效幫助用戶快速的通過摘要完成審計(jì)工作;即便自動摘要描述不清或抽取不對,也可以通過對應(yīng)的原文內(nèi)容進(jìn)行快速修正,極大地節(jié)省了人工審計(jì)成本,提升審計(jì)效率。
技術(shù)領(lǐng)域
本發(fā)明涉及文檔處理領(lǐng)域,具體涉及一種基于摘要方式的機(jī)器輔助閱讀審計(jì)方法及系統(tǒng)。
背景技術(shù)
各個行業(yè)中存在大量文檔閱讀審計(jì)的需求,傳統(tǒng)的文檔閱讀審計(jì)方法是以人為主的文檔閱讀審計(jì)方法,主要處理過程包括:將待審計(jì)的文檔從業(yè)務(wù)信息系統(tǒng)導(dǎo)出后通過業(yè)務(wù)行業(yè)專家用人腦進(jìn)行主觀審查。對于海量的數(shù)據(jù),閱讀量巨大,需要根據(jù)文檔內(nèi)容進(jìn)行理解、判斷、進(jìn)行決策。由于文檔中大量都是無結(jié)構(gòu)化或半結(jié)構(gòu)化的數(shù)據(jù),且寫文檔的人水平思路又不盡相同,造成人在審閱過程中所有內(nèi)容都需要進(jìn)行理解查看,而實(shí)際需要重點(diǎn)關(guān)注的內(nèi)容其實(shí)并不多,時(shí)間成本和人力成本浪費(fèi)嚴(yán)重,且效率低下。
隨著信息技術(shù)近年以來的大力發(fā)展,各種信息數(shù)據(jù)的獲得和提供頻率更加快速,這在一定程度上又加重了專業(yè)審計(jì)的復(fù)雜性和難度,僅靠傳統(tǒng)的文本審計(jì)方法已經(jīng)遠(yuǎn)遠(yuǎn)不能適應(yīng)社會的發(fā)展,不能滿足企業(yè)自身的實(shí)際需求了。目前在審計(jì)行業(yè)中,還沒有成熟的審閱解決方案。
基于上述問題,亟需開發(fā)一種機(jī)器輔助閱讀審計(jì)方法或系統(tǒng),準(zhǔn)確了解文檔的重要內(nèi)容,為審計(jì)人員提供簡要、準(zhǔn)確、重要的文檔內(nèi)容,提高審計(jì)人員工作效率。
發(fā)明內(nèi)容
為了克服上述問題,本發(fā)明人進(jìn)行了銳意研究,提供了一種基于摘要方式的機(jī)器輔助閱讀審計(jì)方法及系統(tǒng),通過對輸入的文檔進(jìn)行分塊分類調(diào)整類別標(biāo)簽、摘要抽取獲得重點(diǎn)關(guān)注信息、以及最后的編輯修改,獲得用戶想要的數(shù)據(jù)效果,實(shí)現(xiàn)審計(jì)文檔摘要輸出,從而完成本發(fā)明。
本發(fā)明的目的在于提供以下技術(shù)方案:
(1)一種基于摘要方式的機(jī)器輔助閱讀審計(jì)方法,所述方法包括以下步驟:
步驟100,錄入文本,并完成數(shù)據(jù)內(nèi)容及格式的解析;
步驟200,對解析后文本內(nèi)容進(jìn)行分類,將相同分類內(nèi)容進(jìn)行聚合并標(biāo)注類別標(biāo)簽,形成帶類別標(biāo)簽的功能區(qū)塊;
步驟300,抽取各功能區(qū)塊中相應(yīng)的摘要內(nèi)容;
步驟400,輸出摘要內(nèi)容,結(jié)合審閱人員的意見,形成審閱結(jié)果。
(2)一種用于實(shí)現(xiàn)上述(1)所述方法的系統(tǒng),所述系統(tǒng)包括:
錄入解析模塊,用于錄入文本,并完成數(shù)據(jù)內(nèi)容及格式的解析;
分塊分類模塊,用于對解析后文本內(nèi)容進(jìn)行分類,將相同分類內(nèi)容進(jìn)行聚合并標(biāo)注類別標(biāo)簽,形成帶類別標(biāo)簽的功能區(qū)塊;
摘要抽取模塊,用于抽取各功能區(qū)塊中相應(yīng)的摘要內(nèi)容;
摘要輸出編輯模塊,用于輸出摘要內(nèi)容,結(jié)合審閱人員的意見,形成審閱結(jié)果。
根據(jù)本發(fā)明提供的一種基于摘要方式的機(jī)器輔助閱讀審計(jì)方法及系統(tǒng),具有以下有益效果:
(1)本發(fā)明中,通過機(jī)器模型,預(yù)先抽取原文摘要,并輔助以摘要的原文信息,幫助用戶快速的通過摘要完成審計(jì)工作;即便自動摘要描述不清或抽取不對,也可以通過對應(yīng)的原文內(nèi)容進(jìn)行快速修正,極大地節(jié)省了人工審計(jì)成本,提升審計(jì)效率;
(2)本發(fā)明中,通過將Word文檔或PDF文檔格式先轉(zhuǎn)化為XML格式,再轉(zhuǎn)化為純文本格式,可保證原始數(shù)據(jù)不丟失,保證解析質(zhì)量;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于鼎復(fù)數(shù)據(jù)科技(北京)有限公司,未經(jīng)鼎復(fù)數(shù)據(jù)科技(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810142416.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 操作調(diào)度系統(tǒng)及方法
- 網(wǎng)絡(luò)電話
- 集成電路熱模擬裝置及方法
- 區(qū)塊鏈節(jié)點(diǎn)演進(jìn)方法及區(qū)塊鏈節(jié)點(diǎn)
- 可配置銀關(guān)的區(qū)塊鏈構(gòu)建方法、裝置及電子設(shè)備
- 一種區(qū)塊鏈網(wǎng)絡(luò)的部署控制方法、裝置、設(shè)備和介質(zhì)
- 一種區(qū)塊處理方法及相關(guān)設(shè)備
- 基于大數(shù)據(jù)的城市開放空間的分類方法及裝置
- 基于區(qū)塊鏈的無線物聯(lián)網(wǎng)系統(tǒng)
- 一種腦功能數(shù)據(jù)分析的個體腦功能網(wǎng)絡(luò)提取方法





