[發(fā)明專利]一種文書劃分方法及裝置有效
| 申請?zhí)枺?/td> | 201910142005.0 | 申請日: | 2019-02-26 |
| 公開(公告)號: | CN109858036B | 公開(公告)日: | 2023-07-28 |
| 發(fā)明(設計)人: | 趙昂;李寶善;盛志超 | 申請(專利權(quán))人: | 科大訊飛股份有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 張小娜;王寶筠 |
| 地址: | 230088 安徽*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文書 劃分 方法 裝置 | ||
本申請公開了一種文書劃分方法及裝置,該方法包括:在對待劃分卷宗進行文書劃分時,首先將待劃分卷宗中的每一頁作為目標頁,然后,分析該目標頁與其上文之間的語義關聯(lián)關系,和/或,分析該目標頁與其下文之間的語義關聯(lián)關系;接著,可以根據(jù)分析出的該待劃分卷宗中的每一頁對應的語義關聯(lián)關系,將該待劃分卷宗進行文書劃分。由于文書之間通常情況下不具有語義關聯(lián)性,基于這些特性,當根據(jù)待劃分卷宗中的每一頁與其上文之間的語義關聯(lián)關系、和/或與其下文之間的語義關聯(lián)關系,對待劃分卷宗進行文書劃分時,相比于過分依賴于標題檢測結(jié)果進行文書劃分的方法,本申請?zhí)岣吡宋臅鴦澐纸Y(jié)果的正確性。
技術(shù)領域
本申請涉及自然語言處理技術(shù)領域,尤其涉及一種文書劃分方法及裝置。
背景技術(shù)
在法院信息化建設過程中,無紙化辦公已成為必先攻克的任務。無紙化辦公主要通過電子卷宗管理系統(tǒng)完成卷宗管理,包括:管理記錄反映案件辦理過程和案件辦理結(jié)果的文字、圖表、聲像等數(shù)字化文件材料。相對于傳統(tǒng)的紙質(zhì)卷宗,它可以海量存放并通過計算機網(wǎng)絡實現(xiàn)多人同時查閱和打印,便于檢查辦案質(zhì)量、加快辦案流程、交流辦案經(jīng)驗、提高辦案水平。
在通過電子卷宗管理系統(tǒng)完成卷宗管理時,其任務之一是法院電子卷宗編目的任務,該任務需要分析電子卷宗材料以進行文書劃分,在進行文書劃分時,由于一個卷宗(如合同糾紛)是由多個文書(如封面、起訴狀、受理通知書、判決書等)組成,可以將該卷宗按每個文書進行劃分和編目。
在現(xiàn)有的文書劃分方法中,首先檢測出卷宗中的標題,然后基于標題檢出結(jié)果進行文書劃分,但是,該文書劃分方法過于依賴于標題檢出結(jié)果,當標題誤檢出或漏檢出時,將導致文書劃分錯誤。
發(fā)明內(nèi)容
本申請實施例的主要目的在于提供一種文書劃分方法及裝置,能夠提高文書劃分結(jié)果的正確性。
本申請實施例提供了一種文書劃分方法,包括:
將待劃分卷宗中的每一頁作為目標頁;
分析所述目標頁與所述目標頁上文之間的語義關聯(lián)關系,和/或,分析所述目標頁與所述目標頁下文之間的語義關聯(lián)關系;
根據(jù)所述待劃分卷宗中的每一頁對應的語義關聯(lián)關系,將所述待劃分卷宗進行文書劃分。
可選的,所述分析所述目標頁與所述目標頁上文之間的語義關聯(lián)關系,包括:
選擇所述目標頁中位置在前的第一數(shù)目的文本行;
選擇所述目標頁的前一頁中位置在后的第二數(shù)目的文本行;
分析所述第一數(shù)目的文本行與所述第二數(shù)目的文本行之間的語義關聯(lián)關系。
可選的,所述分析所述第一數(shù)目的文本行與所述第二數(shù)目的文本行之間的語義關聯(lián)關系,包括:
將所述第一數(shù)目與所述第二數(shù)目的文本行中的每一文本行作為目標文本行,生成所述目標文本行的文本字特征和/或像素位置特征;
根據(jù)生成的特征,分析所述第一數(shù)目的文本行與所述第二數(shù)目的文本行之間的語義關聯(lián)關系。
可選的,所述分析所述目標頁與所述目標頁下文之間的語義關聯(lián)關系,包括:
選擇所述目標頁中位置在后的第三數(shù)目的文本行;
選擇所述目標頁的后一頁中位置在前的第四數(shù)目的文本行;
分析所述第三數(shù)目的文本行與所述第四數(shù)目的文本行之間的語義關聯(lián)關系。
可選的,所述分析所述第三數(shù)目的文本行與所述第四數(shù)目的文本行之間的語義關聯(lián)關系,包括:
將所述第三數(shù)目與所述第四數(shù)目的文本行中的每一文本行作為目標文本行,生成所述目標文本行的文本字特征和/或像素位置特征;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于科大訊飛股份有限公司,未經(jīng)科大訊飛股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910142005.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





