[發明專利]法院名稱的統計方法及裝置有效
| 申請號: | 201610987291.7 | 申請日: | 2016-11-09 |
| 公開(公告)號: | CN108073564B | 公開(公告)日: | 2021-05-14 |
| 發明(設計)人: | 石鵬;王福偉;胡斌 | 申請(專利權)人: | 北京國雙科技有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/30;G06F40/216;G06F16/2458 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 韓建偉;張永明 |
| 地址: | 100083 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 法院 名稱 統計 方法 裝置 | ||
1.一種法院名稱的統計方法,其特征在于,包括:
對目標裁判文書的內容進行解析,得到待處理的法院名稱集合;
通過法院名稱數據庫對所述待處理的法院名稱集合進行區分,區分出所述待處理的法院名稱集合中標準的法院名稱和非標準的法院名稱,其中,所述法院名稱數據庫包括多個標準的法院名稱和多個標準的法院名稱的代碼,每個標準的法院名稱的代碼與每個標準的法院名稱的代碼存在對應關系;
分別對所述待處理的法院名稱集合中每個非標準的法院名稱進行識別處理,識別出所述非標準的法院名稱對應的標準的法院名稱;以及
根據所述待處理的法院名稱集合中標準的法院名稱和所述非標準的法院名稱對應的標準的法院名稱,對所述目標裁判文書中的法院名稱進行統計;
其中,分別對所述待處理的法院名稱集合中每個非標準的法院名稱進行識別處理,識別出所述非標準的法院名稱對應的標準的法院名稱包括:
按照預設規則對所述法院名稱數據庫中存儲的標準的法院名稱進行分詞處理,得到第一區域標識類詞語集合和第一法院名稱標識類詞語集合,其中,所述第一區域標識類詞語集合中包括多個第一區域標識類詞語,所述第一法院名稱標識類詞語集合中包括多個第一法院名稱標識類詞語,所述第一法院名稱標識類詞語與所述第一區域標識類詞語之間存在對應關系;
分別根據所述第一區域標識類詞語集合和所述第一法院名稱標識類詞語集合對所述待處理的法院名稱集合中每個非標準的法院名稱進行識別處理,識別出所述非標準的法院名稱對應的標準的法院名稱。
2.根據權利要求1所述的方法,其特征在于,分別根據所述第一區域標識類詞語集合和所述第一法院名稱標識類詞語集合對所述待處理的法院名稱集合中每個非標準的法院名稱進行識別處理,識別出所述非標準的法院名稱對應的標準的法院名稱包括:
按照所述預設規則對所述待處理的法院名稱集合中每個非標準的法院名稱進行分詞處理,得到第二區域標識類詞語集合和第二法院名稱標識類詞語集合,其中,所述第二區域標識類詞語集合中包括多個第二區域標識類詞語,所述第二法院名稱標識類詞語集合中包括多個第二法院名稱標識類詞語,所述第二法院名稱標識類詞語與所述第二區域標識類詞語之間存在對應關系;
分別將所述第二法院名稱標識類詞語集合中每個第二法院名稱標識類詞語與所述第一法院名稱標識類詞語集合中每個第一法院名稱標識類詞語進行第一匹配操作;
如果存在第二法院名稱標識類詞語與第一法院名稱標識類詞語匹配成功,則將匹配成功的所述第二法院名稱標識類詞語對應的第二區域標識類詞語與匹配成功的所述第一法院名稱標識類詞語對應的第一區域標識類詞語進行第二匹配操作;
如果所述第二匹配操作成功,識別出所述第二區域標識類詞語與所述第二法院名稱標識類詞語對應的非標準的法院名稱為所述第一區域標識類詞語與所述第一法院名稱標識類詞語對應的標準的法院名稱。
3.根據權利要求2所述的方法,其特征在于,在分別將所述第二法院名稱標識類詞語集合中每個第二法院名稱標識類詞語與所述第一法院名稱標識類詞語集合中每個第一法院名稱標識類詞語進行第一匹配操作之后,所述方法還包括:
如果所述第一匹配操作失敗,查找匹配失敗原因;
將查找出的匹配失敗原因紀錄在日志中;以及
按照預設時間周期根據所述日志中紀錄的匹配失敗原因對所述法院名稱數據庫進行更新,其中,在匹配失敗原因指示所述法院名稱數據庫中未記錄非標準的法院名稱時,向所述法院名稱數據庫中增添所述非標準的法院名稱。
4.根據權利要求1所述的方法,其特征在于,在對目標裁判文書的內容進行解析,得到待處理的法院名稱集合之前,所述方法還包括:
對與所述標準的法院名稱的同義詞進行規范化處理,統一為所述標準的法院名稱;和/或,
對與所述標準的法院名稱的常見描述性錯誤的詞進行規范化處理,統一為所述標準的法院名稱。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京國雙科技有限公司,未經北京國雙科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610987291.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:數據的生成方法及裝置
- 下一篇:詞語規范化的方法和設備及機器翻譯方法和設備





