[發明專利]一種基于復合投票機制的類案推送方法及裝置在審
| 申請號: | 202210065479.1 | 申請日: | 2022-01-20 |
| 公開(公告)號: | CN114416965A | 公開(公告)日: | 2022-04-29 |
| 發明(設計)人: | 梁鴻翔 | 申請(專利權)人: | 北京北大英華科技有限公司 |
| 主分類號: | G06F16/335 | 分類號: | G06F16/335;G06F40/194;G06F40/289;G06F40/30;G06F16/35;G06N3/04;G06N3/08;G06Q50/18 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 李慧引 |
| 地址: | 100080 北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 復合 投票 機制 推送 方法 裝置 | ||
本申請公開了一種基于復合投票機制的類案推送方法及裝置,將信息網絡輸入至預設的非監督學習模型中,得到與案情描述之間的相似度大于預設閾值的多個裁判文書。將案情描述的文本嵌入矩陣,輸入至監督學習模型中,得到案情描述的罪名。將與案情描述之間的相似度大于預設閾值的多個裁判文書、以及案情描述的罪名,作為投票機制的參考依據,并利用投票機制從各個裁判文書中選取出目標裁判文書,作為對外推送的裁判文書。將非監督學習模型的輸出結果(即與案情描述之間的相似度大于預設閾值的多個裁判文書)、以及監督學習模型的輸出結果,作為投票機制的參考依據,并利用投票機制從各個裁判文書中選取出目標裁判文書,能顯著提高類案推送的準確性。
技術領域
本申請涉及機器學習技術領域,尤其涉及一種基于復合投票機制的類案推送方法及裝置。
背景技術
在智能革命時代背景下,智慧司法的建設正如火如荼地進行,并已取得階段性進展。與此同時,如何對司法系統中的海量案例進行語義檢索并有效地利用,已經成為了智慧司法研究和計算法學研究的共識。類案推送作為智慧司法領域的核心應用,受到廣泛關注。
目前,傳統的類案推送方法為:統計案情描述中各詞項的出現頻度,以詞頻信息為基礎,基于詞頻-逆文檔頻率(Term Frequency-Inverse Document Frequency,簡稱TF-IDF),計算案情描述與裁判文書之間的相似度,并向外推送相似度較高的多個裁判文書,作為案情描述的裁判依據。然而,傳統的類案推送方法,其各個裁判文書與案情描述之間的相似度計算結果的準確性較低,使得類案推送的準確性大大降低。
發明內容
本申請提供了一種基于復合投票機制的類案推送方法及裝置,目的在于提高類案推送的準確性。
為了實現上述目的,本申請提供了以下技術方案:
一種基于復合投票機制的類案推送方法,包括:
將信息網絡輸入至預設的非監督學習模型中,得到與案情描述之間的相似度大于預設閾值的多個裁判文書;所述信息網絡基于所述案情描述、所述裁判文書、以及案件實體之間的關聯關系預先構建;所述關聯關系基于預設的文本嵌入模型對所述案前描述、以及所述裁判文書進行案件實體識別得到;
將所述案情描述的文本嵌入矩陣,輸入至監督學習模型中,得到所述案情描述的罪名;所述監督學習模型基于樣本裁判文書的文本嵌入矩陣預先訓練得到;所述案情描述的文本嵌入矩陣,基于所述文本嵌入模型對所述案情描述進行文本嵌入矩陣化得到;
將所述與案情描述之間的相似度大于預設閾值的多個裁判文書、以及所述案情描述的罪名,作為投票機制的參考依據,并利用所述投票機制從各個所述裁判文書中選取出目標裁判文書,作為對外推送的裁判文書。
可選的,所述利用所述投票機制從各個所述裁判文書中選取出目標裁判文書,作為對外推送的裁判文書,包括:
所述投票機制,用于:
預先統計各個所述裁判文書的罪名,得到罪名序列;其中,所述罪名序列中的各項罪名,依據所包含的裁判文書的數量從多到少的順序進行排序;
在所述案情描述的罪名位于所述罪名序列的前m位,且位于所述罪名序列中第一序位的罪名所包含的裁判文書的數量大于預設數值的情況下,按照所述裁判文書與所述案情描述之間的相似度從高到低的順序,對所述第一序位的罪名所包含的多個裁判文書進行排序,得到第一文書序列,并將所述第一文書序列中前k位的裁判文書,作為目標裁判文書;其中,m和k均為正整數。
可選的,還包括:
所述投票機制,還用于:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京北大英華科技有限公司,未經北京北大英華科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210065479.1/2.html,轉載請聲明來源鉆瓜專利網。





