[發明專利]基于詞向量模型的法條推薦方法有效
| 申請號: | 201811170180.2 | 申請日: | 2018-09-26 |
| 公開(公告)號: | CN109446416B | 公開(公告)日: | 2021-09-28 |
| 發明(設計)人: | 葛季棟;李傳藝;王子安;馮奕;雷妙妙;周筱羽;駱斌 | 申請(專利權)人: | 南京大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F40/216;G06F40/289;G06F40/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 210093 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 向量 模型 法條 推薦 方法 | ||
本發明公開了一種基于詞向量模型的法條推薦方法,該發明屬于推薦系統技術領域中的協同過濾推薦技術,協同過濾是通過借助相似的事物來為事物推薦或者篩選信息的技術,推薦法條需要借助裁判文書中的基本案件情況獲取其他案情相近的文書,然后根據多個前例推薦法條。本發明與現有方法相比,其顯著優點是:引入詞向量模型后,通過詞向量的計算能夠更準確地表達兩段案件基本情況的相似程度,從而為裁判文書找到案情更相似的文書。并且根據多個相似案情的文書可以采取多種協同過濾推薦策略,獲得更準確的推薦結果。
技術領域
本發明屬于推薦系統技術領域,尤其是推薦系統技術領域中的協同過濾推薦技術,是用于根據訴訟案件的案件基本情況進行推薦法條的技術。
背景技術
近年來,最高人民法院以“大數據、大格局、大服務”理念為指導,積極推進和落實全面依法治國戰略部署,大力推進人民法院信息化建設。裁判文書作為法律審判活動記錄的載體,完整反映了當事人主張、舉證和質證的客觀過程,并全面闡述了裁判結果形成的法律依據、事實證據和推理過程。裁判文書是一類重要的司法數據,截至2018年9月,已有超過5200萬份裁判文書被收錄并公布于中國裁判文書網。
基于海量裁判文書的文本挖掘,將有助于挖掘司法規律,并指導司法實踐,因此,面向司法大數據的研究工作,以及“人工智能+法律”的概念成為熱點研究話題。基于自然語言處理和機器學習的語義檢索,法律問答,法律援助,在線法院等都將使法律行業的運行方式變得更加智能與高效。
在案件審判過程中,法官需要結合當事人的訴求以及案件的證據與事實,閱讀大量的法律法規來選擇合適的法律法條作為依據,從而確定案件判決結果。由于成文法繁多,同一個問題可能會出現在不同的法律規范中,因此法官需要閱讀大量的法律法規,這一過程通常需要耗費大量的時間和精力。由于這個原因,法院工作中的一些矛盾和問題逐漸顯現,其中“同案不同判、法律適用的不統一”便是其中之一,同案同判成為廣大公眾對法律的訴求。對于案件的當事人,在案件咨詢與訴訟過程中,他們往往需要支付高昂的律師咨詢費來了解案件的情況以及可能的判決結果。
法條推薦的價值正體現在這兩方面:一方面法條推薦可以為法官推薦案件可能適用的法條,提高法官的工作效率,幫助法官實現同案同判,確保公平正義,另一方面法條推薦可以幫助當事人了解同類案件的訴訟結果和相關法條,形成最佳的訴訟策略,節約法律咨詢和訴訟的成本。
本發明提出了一種基于詞向量模型的法條推薦方法,詞向量模型是文本語義建模的一種,它使用神經網絡等機器學習技術將自然語言的詞語轉換成低維度的數據。詞向量模型不僅避免了傳統自然語言處理過程中面臨的高維度引發的一系列問題,如計算量龐大、存儲空間受限等問題,而且能夠充分地保留詞語的信息。
詞向量模型優于其它自然語言處理模型還在于其模糊表達的能力,詞向量在向量空間的位置信息蘊含了一定的語義信息。在詞向量模型中,通過向量空間的計算可以獲得詞語之間的上下義關系、總分關系、類義關系(相近關系、相反關系等)詞語對之間的對應關系等,極大地擴展了語言處理的能力,是傳統自然語言模型難以簡單完成的。
借助詞向量模型強大的文本語義表達能力,基于詞向量模型的文本處理度量方法如詞移動距離(Word Mover’s Distance,簡稱WMD)、松弛詞移動距離(Relaxed WMD,簡稱RWMD)、詞矩心距離(Word Centroid Distance,簡稱WCD)產生,相比于傳統方法如詞袋模型(Bag of words)詞頻及逆文本頻率指數統計方法(Term Frequency-Inverse DocumentFrequency,簡稱TF-IDF)、隱狄利克雷文檔主題生成模型(Latent Dirichlet Allocation,簡稱LDA)的優勢在于,它們在處理文檔相似程度這一類問題上,借助詞向量模型的模糊表達能力和向量空間的計算,可以更好地度量文檔之間的相似程度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大學,未經南京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811170180.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種應用推薦、獲取方法及設備
- 下一篇:一種智能化檢索方法和裝置





