[發(fā)明專利]法律文書信息提取方法、裝置、計算機設(shè)備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 201910651409.2 | 申請日: | 2019-07-18 |
| 公開(公告)號: | CN110516036A | 公開(公告)日: | 2019-11-29 |
| 發(fā)明(設(shè)計)人: | 戴廣宇;周萌 | 申請(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06Q50/18 |
| 代理公司: | 44325 深圳眾鼎專利商標代理事務(wù)所(普通合伙) | 代理人: | 黃章輝<國際申請>=<國際公布>=<進入 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 關(guān)鍵詞集合 預設(shè) 法律文本 解析規(guī)則 詞集合 關(guān)鍵信息 文書信息 匹配度 法律 關(guān)聯(lián) 計算機設(shè)備 存儲介質(zhì) 獲取信息 數(shù)據(jù)分析 提取規(guī)則 有效地 解析 匹配 | ||
1.一種法律文書信息提取方法,其特征在于,包括:
獲取待解析的法律文本;
利用重點詞提取規(guī)則從所述法律文本提取重點詞,并基于所述重點詞形成重點詞集合;
將所述重點詞集合分別與多個預設(shè)的關(guān)鍵詞集合匹配,計算所述重點詞集合與各個所述關(guān)鍵詞集合的匹配度,所述每個關(guān)鍵詞集合均包括至少一個關(guān)鍵詞,一個所述關(guān)鍵詞集合與一個預設(shè)解析規(guī)則關(guān)聯(lián);
獲取與匹配度最高的關(guān)鍵詞集合關(guān)聯(lián)的所述預設(shè)解析規(guī)則;
根據(jù)所述預設(shè)解析規(guī)則從所述法律文本中提取關(guān)鍵信息。
2.如權(quán)利要求1所述的法律文書信息提取方法,其特征在于,所述獲取待解析的法律文本之前,包括:
獲取法律文書;
識別所述法律文書的文書類型;
獲取與所述文書類型匹配的劃分規(guī)則;
根據(jù)所述劃分規(guī)則將所述法律文書劃分為至少一個所述待解析的法律文本。
3.如權(quán)利要求1所述的法律文書信息提取方法,其特征在于,所述利用重點詞提取規(guī)則從所述法律文本提取重點詞,并基于所述重點詞形成重點詞集合,包括:
獲取預設(shè)重點詞集合,所述預設(shè)重點詞集合中包含至少一個重點詞匯;
根據(jù)預設(shè)分詞規(guī)則將所述法律文本處理為詞匯集合,所述詞匯集合包括多個待識別詞匯;
判斷所述預設(shè)重點詞集合中是否存在與所述待識別詞匯匹配的所述重點詞匯;
若存在與所述待識別詞匯匹配的重點詞匯,則將與所述重點詞集合中的所述重點詞匯匹配的所述待識別詞匯標記為重點詞;
將所述重點詞加入所述重點詞集合。
4.如權(quán)利要求1所述的法律文書信息提取方法,其特征在于,所述將所述重點詞集合分別與多個關(guān)鍵詞集合匹配,計算所述重點詞集合與各個所述關(guān)鍵詞集合的匹配度,所述關(guān)鍵詞集合包括至少一個的關(guān)鍵詞,包括:
獲取指定關(guān)鍵詞集合的匹配規(guī)則,所述指定關(guān)鍵詞集合為多個所述關(guān)鍵詞集合中的一個;
根據(jù)所述匹配規(guī)則分別確定所述重點詞集合內(nèi)的各個重點詞與所述指定關(guān)鍵詞集合中的關(guān)鍵詞的關(guān)聯(lián)系數(shù);
根據(jù)所述關(guān)聯(lián)系數(shù)計算所述重點詞集合與所述指定關(guān)鍵詞集合的匹配度。
5.如權(quán)利要求1所述的法律文書信息提取方法,其特征在于,所述利用重點詞提取規(guī)則從所述法律文本提取重點詞,并基于所述重點詞形成重點詞集合之后,還包括:
將所述重點詞集合以指定形式輸入預設(shè)的解析模型,獲取所述預設(shè)的解析模型輸出的法律文本標簽;
獲取與所述法律文本標簽匹配的預設(shè)解析規(guī)則;
根據(jù)所述預設(shè)解析規(guī)則從所述法律文本中提取關(guān)鍵信息。
6.如權(quán)利要求2所述的法律文書信息提取方法,其特征在于,所述根據(jù)所述預設(shè)解析規(guī)則從所述法律文本中提取關(guān)鍵信息之后,還包括:
判斷所述法律文書中是否還存在未提取關(guān)鍵信息的待解析的法律文本;
若所述法律文書中還存在未提取關(guān)鍵信息的待解析的法律文本,則繼續(xù)獲取所述未提取關(guān)鍵信息的待解析的法律文本,并從所述未提取關(guān)鍵信息的待解析的法律文本中提取關(guān)鍵信息;
若所述法律文書中不存在未提取關(guān)鍵信息的待解析的法律文本,則將從各個所述待解析的法律文本中提取出的所述關(guān)鍵信息與所述法律文書的標識關(guān)聯(lián)存儲。
7.一種法律文書信息提取裝置,其特征在于,包括:
獲取模塊,用于獲取待解析的法律文本;
重點詞集合模塊,用于利用重點詞提取規(guī)則從所述法律文本提取重點詞,并基于所述重點詞形成重點詞集合;
匹配度計算模塊,用于將所述重點詞集合分別與多個預設(shè)的關(guān)鍵詞集合匹配,計算所述重點詞集合與各個所述關(guān)鍵詞集合的匹配度,所述每個關(guān)鍵詞集合均包括至少一個關(guān)鍵詞;一個所述關(guān)鍵詞集合與一個預設(shè)解析規(guī)則關(guān)聯(lián);
獲取解析規(guī)則模塊,用于獲取與匹配度最高的關(guān)鍵詞集合關(guān)聯(lián)的所述預設(shè)解析規(guī)則;
提取信息模塊,用于根據(jù)所述預設(shè)解析規(guī)則從所述法律文本中提取關(guān)鍵信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910651409.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種提高法律文件翻譯準確性的方法
- 一種法律文本的量子聚類系統(tǒng)及方法
- 法律相關(guān)文本的歸類方法、歸類裝置及相應(yīng)的電子設(shè)備
- 法律數(shù)據(jù)處理方法、裝置、計算機設(shè)備和存儲介質(zhì)
- 一種法律文本歸檔方法、裝置、可讀存儲介質(zhì)及終端設(shè)備
- 基于法律文本精確匹配和矛盾檢測的系統(tǒng)及方法
- 法律領(lǐng)域文本分析識別方法、系統(tǒng)、存儲介質(zhì)及終端
- 一種法律裁判文書的案由分類方法和終端
- 法律文本相似度閾值調(diào)整方法、裝置及電子設(shè)備
- 一種基于合同文本標記語言的法律合同交互式標注方法
- 解碼方法和裝置、報文解析方法和裝置以及解析設(shè)備
- 一種動態(tài)激活與調(diào)整的日志解析方法和系統(tǒng)
- 一種用戶自定義規(guī)則實時解析日志數(shù)據(jù)的方法與系統(tǒng)
- 錯誤碼解析方法及裝置
- 流水文件的分析處理方法、裝置、設(shè)備和存儲介質(zhì)
- 一種可繼承可擴展的數(shù)據(jù)處理方法及其對解析日志的應(yīng)用
- 一種確定目標文本要素的方法及裝置
- 一種可擴展的新聞網(wǎng)站通用爬蟲方法及系統(tǒng)
- 規(guī)則引擎的規(guī)則更新方法、裝置、設(shè)備及介質(zhì)
- 一種可擴展標記語言解析系統(tǒng)及方法





