[發(fā)明專利]一種裁判文書結(jié)構(gòu)化方法及裝置在審
| 申請?zhí)枺?/td> | 202010041162.5 | 申請日: | 2020-01-15 |
| 公開(公告)號: | CN111222312A | 公開(公告)日: | 2020-06-02 |
| 發(fā)明(設(shè)計(jì))人: | 席麗娜;王文軍;晉耀紅 | 申請(專利權(quán))人: | 中科鼎富(北京)科技發(fā)展有限公司 |
| 主分類號: | G06F40/186 | 分類號: | G06F40/186;G06F40/103;G06F40/258;G06F40/30;G06Q50/18 |
| 代理公司: | 北京弘權(quán)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11363 | 代理人: | 逯長明;許偉群 |
| 地址: | 100089 北京市海淀區(qū)萬*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 裁判 文書 結(jié)構(gòu) 方法 裝置 | ||
本申請?zhí)峁┝艘环N裁判文書結(jié)構(gòu)化方法及裝置,其中,文本處理器在接收到待處理裁判文書之后,按照目標(biāo)抽取模板中每一抽取節(jié)點(diǎn),確定待處理裁判文書中的節(jié)點(diǎn)字符,并確定每一所述抽取節(jié)點(diǎn)對應(yīng)的塊文本,從而完成對待處理裁判文書的文本的對應(yīng)抽取工作。最后,將每一所述抽取節(jié)點(diǎn)與所述塊文本相對應(yīng),生成所述待處理裁判文書的結(jié)構(gòu)化文本,此時(shí)經(jīng)過結(jié)構(gòu)化之后的待處理裁判文書具有標(biāo)準(zhǔn)的格式,可以令用戶通過瀏覽抽取節(jié)點(diǎn)確定所要查找的內(nèi)容,并快速對應(yīng)至相關(guān)的具體內(nèi)容。
技術(shù)領(lǐng)域
本申請涉及文本處理技術(shù)領(lǐng)域,尤其涉及一種裁判文書結(jié)構(gòu)化方法及裝置。
背景技術(shù)
通常,裁判文書等一類的法律文件的內(nèi)容較為冗長,而且用詞較為晦澀難懂,令人很難快速從整體裁判文書中定位需要仔細(xì)瀏覽的內(nèi)容。而且,用戶在瀏覽裁判文書的過程中,通常會(huì)需要瀏覽一些類案,即與當(dāng)前裁判文書相類似的案件對應(yīng)的裁判文書,以幫助理解和類比當(dāng)前裁判文書。對于用戶來說,瀏覽一篇裁判文書已經(jīng)比較困難,要從海量的裁判文書中找到與當(dāng)前裁判文書類似的裁判文書會(huì)更加困難,不僅會(huì)浪費(fèi)大量時(shí)間,而且也未必能夠準(zhǔn)確找到相似度最高的裁判文書。
具體地,例如用戶需要從裁判文書中查找與審理過程相關(guān)的內(nèi)容,則需要從裁判文書的首個(gè)字符開始瀏覽,直至找到與審理過程相關(guān)的部分;若用戶需要查找裁判文書A的類案,則首先需要瀏覽裁判文書A的全文,在至少大致理解裁判文書A的基礎(chǔ)上,再從保存有各種裁判文書的庫中逐個(gè)瀏覽每個(gè)裁判文書,在大致理解各個(gè)裁判文書的基礎(chǔ)上,才能夠確定出裁判文書A的類案。可見,現(xiàn)有瀏覽裁判文書的方式效率和質(zhì)量較低。
發(fā)明內(nèi)容
本申請?zhí)峁┝艘环N裁判文書結(jié)構(gòu)化方法及裝置,以提高裁判文書的格式規(guī)范性,方便用戶瀏覽。
第一方面,本申請?zhí)峁┝艘环N裁判文書結(jié)構(gòu)化方法,所述方法包括:
按照目標(biāo)抽取模板中每一抽取節(jié)點(diǎn),確定待處理裁判文書中的節(jié)點(diǎn)字符,所述目標(biāo)抽取模板由所述抽取節(jié)點(diǎn)組成,所述抽取節(jié)點(diǎn)為與所述待處理裁判文書中各部分文本具有對應(yīng)關(guān)系的字符串,所述節(jié)點(diǎn)字符為所述待處理裁判文書中與所述抽取節(jié)點(diǎn)相對應(yīng)的部分文本的起始字符;
確定每一所述抽取節(jié)點(diǎn)對應(yīng)的塊文本,所述塊文本由從所述抽取節(jié)點(diǎn)對應(yīng)的節(jié)點(diǎn)字符起到下一節(jié)點(diǎn)字符之間的全部字符;
將每一所述抽取節(jié)點(diǎn)與所述塊文本相對應(yīng),生成所述待處理裁判文書的結(jié)構(gòu)化文本。
第二方面,本申請?zhí)峁┝艘环N裁判文書結(jié)構(gòu)化裝置,所述裝置包括:
節(jié)點(diǎn)字符確定單元,用于按照目標(biāo)抽取模板中每一抽取節(jié)點(diǎn),確定待處理裁判文書中的節(jié)點(diǎn)字符,所述目標(biāo)抽取模板由所述抽取節(jié)點(diǎn)組成,所述抽取節(jié)點(diǎn)為與所述待處理裁判文書中各部分文本具有對應(yīng)關(guān)系的字符串,所述節(jié)點(diǎn)字符為所述待處理裁判文書中與所述抽取節(jié)點(diǎn)相對應(yīng)的部分文本的起始字符;
塊文本確定單元,用于確定每一所述抽取節(jié)點(diǎn)對應(yīng)的塊文本,所述塊文本由從所述抽取節(jié)點(diǎn)對應(yīng)的節(jié)點(diǎn)字符起到下一節(jié)點(diǎn)字符之間的全部字符;
結(jié)構(gòu)化文本生成單元,用于將每一所述抽取節(jié)點(diǎn)與所述塊文本相對應(yīng),生成所述待處理裁判文書的結(jié)構(gòu)化文本。
由以上技術(shù)可知,本申請?zhí)峁┝艘环N裁判文書結(jié)構(gòu)化方法及裝置,其中,文本處理器在接收到待處理裁判文書之后,按照目標(biāo)抽取模板中每一抽取節(jié)點(diǎn),確定待處理裁判文書中的節(jié)點(diǎn)字符,并確定每一所述抽取節(jié)點(diǎn)對應(yīng)的塊文本,從而完成對待處理裁判文書的文本的對應(yīng)抽取工作。最后,將每一所述抽取節(jié)點(diǎn)與所述塊文本相對應(yīng),生成所述待處理裁判文書的結(jié)構(gòu)化文本,此時(shí)經(jīng)過結(jié)構(gòu)化之后的待處理裁判文書具有標(biāo)準(zhǔn)的格式,可以令用戶通過瀏覽抽取節(jié)點(diǎn)確定所要查找的內(nèi)容,并快速對應(yīng)至相關(guān)的具體內(nèi)容。
附圖說明
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中科鼎富(北京)科技發(fā)展有限公司,未經(jīng)中科鼎富(北京)科技發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010041162.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 卡片結(jié)構(gòu)、插座結(jié)構(gòu)及其組合結(jié)構(gòu)
- 鋼結(jié)構(gòu)平臺(tái)結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 單元結(jié)構(gòu)、結(jié)構(gòu)部件和夾層結(jié)構(gòu)
- 鋼結(jié)構(gòu)扶梯結(jié)構(gòu)
- 鋼結(jié)構(gòu)隔墻結(jié)構(gòu)
- 鋼結(jié)構(gòu)連接結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





