[發明專利]一種基于大數據的律師評估方法及推薦方法有效
| 申請號: | 201810271936.6 | 申請日: | 2018-03-29 |
| 公開(公告)號: | CN108509588B | 公開(公告)日: | 2021-03-23 |
| 發明(設計)人: | 李明奇;楊開平;王志勇;覃思義;李良;何國良;張勇;李厚彪;李小平 | 申請(專利權)人: | 李明奇 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06F16/26;G06F16/36;G06F40/289;G06F40/194 |
| 代理公司: | 成都頂峰專利事務所(普通合伙) 51224 | 代理人: | 王霞 |
| 地址: | 610000 四川省成都市*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 數據 律師 評估 方法 推薦 | ||
1.一種基于大數據的律師評估方法,其特征在于:包括以下步驟:
S1.采集用戶發布的法律問題及律師回答對應法律問題的答復信息,形成數據庫;
S2.對步驟S1中的數據庫進行預處理,剔除掉無效數據,形成有效數據庫,進行預處理的具體步驟如下:
S201.將步驟S1中的數據庫中法律問題與預存的無效問題進行比對,將比對結果一致的法律問題及其對應的答復進行剔除,形成初次預處理數據庫;
S202.對步驟S201中的初次預處理數據庫中的法律問題的文本長度L設置模型參考閾值k,將文本長度L參考閾值k的法律問題及其對應的答復進行剔除,形成有效數據庫;
S3.對步驟S2中有效數據庫進行評估,得到每個律師的專業水平數據,得到專業水平數據的具體步驟如下:
S301.將當前律師在回答法律問題的所有答復信息中的關鍵詞與法律專業領域的詞匯庫進行對比分析,通過詞語語義相似度得到有效數據庫中所有律師的專業水平的第一排名;
S302.將當前律師在回答法律問題的所有答復信息中引用法律條文的答復信息數目Nlaw與所有的答復信息數目N0進行計算,通過Nlaw/N0的比值得到有效數據庫中所有律師的專業水平的第二排名;
S303.將當前律師在回答法律問題的所有答復信息的文本長度分別進行基于對數函數的計算,通過答復信息的充實程度得到有效數據庫中所有律師的專業水平的第三排名,所述的答復信息的充實程度需滿足:
其中,Li為當前律師對第i條法律法律問題進行答復時對應的答復信息的文本長度,m為常數,N0為數據庫中當前律師回復的所有法律問題的數目;
S304.將當前律師在回答法律問題的所有答復信息與差答復關鍵詞集合Tkey分別進行比對,當一條答復信息出現Tkey即判定當前答復信息為差答復,通過差答復的數量得到有效數據庫中所有律師的專業水平的第四排名;
S305.將當前律師在回答法律問題的所有答復信息的關鍵字之間進行相似度判斷,通過當前律師的答復相似度得到有效數據庫中所有律師的專業水平的第五排名;
將當前律師在回答法律問題的所有答復信息的關鍵字之間進行相似度判斷時,設Ak={wk1,wk2,wk3,…,wki,…,wkk}表示的是詞語個數為k的一條答復信息的詞集,其中,wki表示Ak中的第i個詞語;設Ap={wp1,wp2,wp3,…wpi,…,wpp}表示的是詞語個數為p的答復信息的詞集,其中,wpi表示Ap中的第i個詞語;
Mijn為第n次去掉矩陣Skp的第i行和第j列的余子陣;答復信息Ak和答復信息Ap的相似矩陣記為Skp=(sij),其中
sij=TEXTSIM(ωki,wpj)(i=1,2,3,…,k;j=1,2,3,…,p);
答復信息Ak和答復信息Ap的相似度的判斷步驟如下:
S305a.找出相似矩陣Skp的第1行的最大值在第i列,這個最大值記為m1,再去掉矩陣中的這個最大值所在的行列,即去掉矩陣Skp的第1行和第i列得到余子陣M1i1;
S305b.找余子陣M1i1第1行的最大值在第j列,這個最大值記為m2,再去掉矩陣M1i1中第1行的這個最大值所在的行列,即去掉矩陣M1i1的第1行和第j列得到余子陣M1j2;
S305c.重復步驟S305a與步驟S305b,直到得到余子陣為空矩陣,則答復信息Ak和答復信息Ap之間的相似度滿足:
其中,l為查找的次數;TEXTSIM(Ak,Ap)的值越大,表示答復信息Ak和答復信息Ap的相似度越高;
S306.通過S301中的第一排名、S302中的第二排名、S303中的第三排名、S304中的第四排名及S305中的第五排名得到有效數據庫中所有律師的專業水平的最終排名,所述的最終排名即為專業水平數據;
S4.對步驟S2中有效數據庫進行評估,得到每個律師的擅長領域數據;
得到擅長領域數據時,統計不同的法律的專業領域的專業詞語,并將當前律師在回答法律問題的所有答復信息中關鍵字與各個專業領域的專業詞語分別進行比對,通過比對結果得到擅長領域數據;
將當前律師在回答法律問題的所有答復信息中關鍵字與各個專業領域的專業詞語分別進行比對時,具體步驟如下:
S401a.將有效數據庫中的每個律師的答復信息進行分組處理,即分成每一個問答對;
S401b.將步驟S401a中得到的問答對中的答復信息的文本進行特征詞匯提取;
S401c.將步驟S401b中提取出的特征詞匯和專業領域詞語Sp(p為0,1,2,3,4,…,T)計算相似度值,然后得到每個特征詞匯所屬的專業領域,并為每個特征詞匯標記領域標簽,得到標簽特征詞匯;
計算相似度值時,設律師當前答復信息中第i個詞語為wi,專業領域p中的第j個詞語為wpj;
計算wi與wpj的相似度時,當wi=wpj時,在基于之前詞向量的基礎上增加其權重為w=1+s;對于當前答復信息中詞語wi和專業領域中的詞語wpj之間的相似度SIMp(wi,wpj)需滿足:
S401d.將步驟S401c中得到的標簽特征詞匯進行分類處理,則含有最多數目的標簽特征詞匯的專業領域即為當前律師最擅長的專業領域,由此得到當前律師的擅長領域信息;
S401e.采集步驟S401a中得到的問答對中的法律問題的數量,設當前律師在任一專業領域中答復的法律問題為Nfield,當前律師答復的所有法律問題的數量為N0,通過Nfield/N0得到有效數據庫中當前律師的擅長領域信息;
將步驟S401d中得到的擅長領域信息與步驟S401e中得到的擅長領域信息結合進行加權計算即可得到當前律師的擅長領域數據;
S5.將步驟S3中的專業水平數據及步驟S4中的擅長領域數據與對應的律師信息均存儲至有效數據庫。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于李明奇,未經李明奇許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810271936.6/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





