[發明專利]一種法院案件判決預測方法有效
| 申請號: | 202110548108.4 | 申請日: | 2021-05-19 |
| 公開(公告)號: | CN113033176B | 公開(公告)日: | 2021-09-17 |
| 發明(設計)人: | 姜森;謝紹韞 | 申請(專利權)人: | 蘇州黑云智能科技有限公司 |
| 主分類號: | G06F40/194 | 分類號: | G06F40/194;G06F40/126;G06F40/289;G06F40/295;G06K9/46;G06K9/62;G06Q10/04;G06Q50/18 |
| 代理公司: | 北京同恒源知識產權代理有限公司 11275 | 代理人: | 葉丙靜 |
| 地址: | 215000 江蘇省蘇州市中國(江蘇)自由貿易試驗區*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 法院 案件 判決 預測 方法 | ||
1.一種法院案件判決預測方法,其特征在于:該方法為對案情全文進行分析和特征提取,并基于提取好的訓練數據,訓練預測模型,預測案件刑期,輔助法院工作人員判案參考;具體包括以下步驟:
S1:罪名分析采用基于規則的方法和相似度模型的方法對案件罪名進行分析;
S2:特征提取采用基于規則的方法和基于實體識別的方法對案件中的關鍵特征要素進行提取;
基于規則的方法為:
基于法院案件判決書句法格式構建罪名句式規則庫,通過正則表達式提取與規則庫相匹配的罪名數據;若提取失效,未從判決書中提取到罪名數據,則采用相似度模型對罪名進行預測分析;
預測分析的方法為:基于若干同案文檔,進行分詞去停用詞后,將語料詞的one-hot向量作為詞向量word2vec的輸入,基于word2vec訓練低維詞向量,將不可計算非結構化的詞轉化為可計算結構化的向量,訓練出同案罪名的上下文語料庫模型,利用訓練好的模型對一段新的判決文書上下文進行罪名預測,彌補基于規則的罪名分析方法的不足;
其中基于word2vec訓練低維詞向量包括跳轉圖Skip-gram處理和連續詞匯CBOW的處理:
Skip-gram處理為:
S11:確定窗口大小window,對每個詞生成2*window個訓練樣本:(i, i-window),(i,i-window+1),...,(i, i+window-1),(i, i+window);
S12:確定batch_size,batch_size的大小是2*window的整數倍,以確保每個batch包含一個詞匯對應的所有樣本;
S13:訓練算法有兩種:層次0-1曲線Softma和小議負采樣Negative Sampling;
S14:神經網絡迭代訓練一定次數,得到輸入層到隱藏層的參數矩陣,矩陣中每一行的轉置即是對應詞的詞向量;
CBOW的處理為:
S21:確定窗口大小window,對每個詞生成2*window個訓練樣本:(i-window, i),(i-window+1, i),...,(i+window-1, i),(i+window, i);
S22:確定batch_size,batch_size的大小是2*window的整數倍,以這確保每個batch包含一個詞匯對應的所有樣本;
S23:訓練算法有兩種:層次Softmax和Negative Sampling;
S24:神經網絡迭代訓練一定次數,得到輸入層到隱藏層的參數矩陣,矩陣中每一行的轉置是對應詞的詞向量;
S3:將提取出來的關鍵特征通過獨熱one-hot編碼向量化為數值,構建成訓練數據;
利用one-hot編碼,對訓練數據進行處理;
用N位狀態寄存器編碼N個狀態,每個狀態都有獨立的寄存器位,且這些寄存器位中只有一位或多位有效,然后得到只有0和1的數據集;
S4:對S3得到的數據集進行訓練,采用支持向量機SVM算法和邏輯回歸LR算法對S3處理完成的特征進行訓練;
采用支持向量機SVM算法包括以下步驟:
S411:生成SVM描述文件;
S412:將描述文件讀入容器中;
S413:讀入樣本數量,生成樣本矩陣和類型矩陣;
S414:提取多維數字表示的方向梯度直方圖HOG特征;
S415:將HOG特征寫入txt文件;
S416:進行SVM訓練;
邏輯回歸LR算法包括以下步驟:
S421:處理數據;
S422:初始化參數;
S423:梯度下降;
S424:模型保存;
S5:預測案情量刑;
S6:通過用戶界面輸入的文本、文件和選項信息,調用預測模型得到預測結果,將預測結果顯示在用戶頁面上。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州黑云智能科技有限公司,未經蘇州黑云智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110548108.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種化學實驗用取藥品裝置
- 下一篇:一株肺炎克雷伯菌噬菌體及醫用用途





