[發明專利]目標主體畫像分析的方法、裝置、計算機裝置及存儲介質有效
| 申請號: | 201910173517.3 | 申請日: | 2019-03-07 |
| 公開(公告)號: | CN110175233B | 公開(公告)日: | 2022-03-11 |
| 發明(設計)人: | 劉玉強;方俊波;鄢真;楊昊燃;李雯;葉素蘭 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35 |
| 代理公司: | 深圳市賽恩倍吉知識產權代理有限公司 44334 | 代理人: | 楊毅玲 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標 主體 畫像 分析 方法 裝置 計算機 存儲 介質 | ||
1.一種利用裁判文書進行目標主體畫像分析的方法,應用于一計算機裝置中,其特征在于,所述利用裁判文書進行目標主體畫像分析的方法包括:
將每一裁判文書劃分為多個預設的文書組成部分;
確定至少一需進行標簽標記的文書組成部分,確定每一需進行標簽標記的文書組成部分所對應的標簽集,其中,所述標簽集為預定義標簽以及自定義標簽中的其中一種,所述預定義標簽集包括多個預定義標簽;
判斷所確定的每一標簽集為預定義標簽集或是自定義標簽集;
當其中一所確定的標簽集為預定義標簽集時,從所述裁判文書中定位所確定的標簽集中每一預定義標簽的位置,并將所述預定義標簽標記至與所述位置對應的段落,提取每一預定義標簽所在的位置后對應的文本內容,并將所提取的文本內容與所述預定義標簽相關聯;所述提取每一預定義標簽所在的位置后對應的文本內容包括:識別所述預定義標簽之后與所述預定義標簽位于同一段落的文書內容,對所述文書內容進行語言邏輯關系分析,從而將所述預定義標簽后的文書內容拆分為至少一詞語單元,將符合所述關鍵詞的語義的詞語單元作為所述預定義標簽對應的所述文本內容提取出來;
當其中一所確定的標簽集為自定義標簽集時,從所述文書組成部分中提取核心關鍵詞,將所述核心關鍵詞作為自定義標簽標記至所述核心關鍵詞所在的段落,并將所述核心關鍵詞加入所述自定義標簽集中;
結合所有所述裁判文書的預定義標簽以及自定義標簽對所述目標主體進行畫像分析;以及
將所述預定義標簽集以及所述自定義標簽集合并為新的標簽集,使得所述計算機裝置可使用所述新的標簽集對其它裁判文書進行標記。
2.如權利要求1所述的利用裁判文書進行目標主體畫像分析的方法,其特征在于,所述從所述文書組成部分中提取核心關鍵詞包括:
過濾所述文書組成部分中包括標點和特殊符號在內的非用詞;對過濾后的所述文書組成部分進行語言邏輯關系分析,從而將所述文書組成部分拆分為多個詞語單元;以及
將能夠體現所述文書組成部分的結論和意義的至少一詞語單元作為所述核心關鍵詞。
3.如權利要求1所述的利用裁判文書進行目標主體畫像分析的方法,其特征在于,所述結合所有裁判文書的標簽對目標主體進行畫像分析包括:
篩選出所有所述裁判文書中包含所述目標主體在內的文本內容以及與所述文本內容關聯的所有預定義標簽以及自定義標簽;以及
結合所述裁判文書的其它預定義標簽以及其它自定義標簽所關聯的文本內容對所述目標主體進行畫像分析,所述其它預定義標簽以及其它自定義標簽為根據所述目標主體所需得到的至少一屬性進行選擇。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910173517.3/1.html,轉載請聲明來源鉆瓜專利網。





