[發明專利]基于婚姻法司法判決文書大數據的智能法律咨詢輔助系統在審
| 申請號: | 201811439165.3 | 申請日: | 2018-11-29 |
| 公開(公告)號: | CN109582964A | 公開(公告)日: | 2019-04-05 |
| 發明(設計)人: | 孫學梅;范靖宇;李端陽;李香迎;祝飛鴻;閆浩然;李翔;康天雨 | 申請(專利權)人: | 天津工業大學 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06Q50/18 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 300387 *** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 輔助系統 法律咨詢 大數據 用戶關鍵詞 多重分析 法律裁決 機器學習 智能 智能化 詞庫 算法 咨詢 分析 采集 驗證 法律 判決 節約 中文 分配 司法 合作 | ||
1.一種基于婚姻法司法判決文書大數據的智能法律咨詢輔助系統,其特征在于,包括以下步驟:
(1)首創基于婚姻法司法判決文書大數據和推薦系統結合。
2.根據權利要求1所述的基于婚姻法司法判決文書大數據的智能法律咨詢輔助系統,其特征在于,所述的步驟(1)中基于大數據采集包括以下步驟:
(2.A)準備,使用瀏覽器正常訪問聚法案例網站,獲取爬蟲時訪問網頁的憑證cookie獲取請求數據FormData,作為爬取相關判決文書的搜索條件;
(2.B)爬取判決文書id,使用requests模擬訪問,傳遞對應參數后獲得“變更撫養關系糾紛”的判決文書第一個索引頁的json數據,通過對json數據的解析,獲取了第一頁的20份判決文書的id值,修改FormData的相關數據,即可依次獲取之后的判決文書索引的json數據,進而獲取更多的判決文書id;
(2.C)解析判決文書網頁,聚法案例判決文書網的文書詳情頁的url為https://www.jufaanli.com/wenshu/加上文書id值,使用requests請求該url,即可獲取對應id的判決文書詳情。聚法案例判決文書網上的判決文書有按對應標題,如“當事人信息”、“審理經過”等對判決文書進行劃分,使用beautifulsoup對該網頁進行解析,篩選判決文書正文不同部分,并將對應部分寫入mongodb數據庫。
3.根據權利要求1所述的基于婚姻法司法判決文書大數據的智能法律咨詢輔助系統,其特征在于,所述的步驟(1)中智能化的實現包括以下步驟:
(3.A)利用KNN算法,將判決文書和已進行咨詢的用戶案例進行聚類,當有新的用戶訴求時,首先判斷用戶訴求在判決文書聚類結果中位置,以降低余弦相似度計算量。
(3.B)確定該用戶在用戶案例聚類結果中位置,根據成功的用戶案例對反饋結果進行調節。
4.根據權利要求1所述的基于婚姻法司法判決文書大數據的智能法律咨詢輔助系統,其特征在于,所述的步驟(1)中法律行業的專業中文分詞庫包括以下步驟:
(4.A)從mongodb數據庫中讀取999份判決文書,將未進行分詞判決文書存放在列表documents中,將分詞后的判決文書存放在列表splitDocuments中;
(4.B)對分詞后的結果集texts進行遍歷,統計其中詞wi出現的頻數,從未進行分詞的判決文書集documents中統計詞(wi-1,wi)的頻數;
(4.C)計算條件概率P(wi|wi-1)。P(wi|wi-1)=P(wi-1,wi)/P(wi-1),通過大量數據測試發現,條件概率P(wi|wi-1)>0.9時,即可認為詞wi-1,wi在判決文書中是作為一個整體出現,可合并,同時,對于結果中出現的人名等通用性不強的詞,通過人工干預進行剔除,使得整個詞庫更適用于法律行業,完成后的詞庫作對分詞工具的補充添加進通用詞庫中。
5.根據權利要求1所述的基于婚姻法司法判決文書大數據的智能法律咨詢輔助系統,其特征在于,所述的步驟(1)中針對法律行業的ETL算法包括以下步驟:
(5.A)只選取判決文書中的“本院查明”部分作為整個案件的事實依據,用來和關鍵研判信息匹配;選取“本院認為”部分作為提供給用戶的案例參考;選取“判決結果”部分作為提供給用戶的數據化結果的數據來源;
(5.B)判決文書其他部分作為法律行業的專業中文分詞庫的語料庫。
6.根據權利要求1所述的基于婚姻法司法判決文書大數據的智能法律咨詢輔助系統,其特征在于,所述的步驟(1)中機器學習算法的應用包括以下步驟:
使用通用字典,基于TF-IDF算法對大量的判決文書進行初步的中文分詞;基于馬爾科夫假設,對初步分詞結果進行二次處理,生成基于法律行業的專業中文分詞庫;通過詞向量之間余弦相似度的計算,得出關鍵研判信息和案例之間的相似度;基于TextRank算法對選定的判決文書關鍵部分進行摘要生成。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津工業大學,未經天津工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811439165.3/1.html,轉載請聲明來源鉆瓜專利網。





