[發(fā)明專利]用于自動地標識文檔中的潛在重要事實的系統(tǒng)及方法有效
| 申請?zhí)枺?/td> | 201580063042.2 | 申請日: | 2015-11-19 |
| 公開(公告)號: | CN107209750B | 公開(公告)日: | 2020-08-18 |
| 發(fā)明(設(shè)計)人: | M·佩蒂亞拉;G·奧斯古德;J·A·邁爾斯 | 申請(專利權(quán))人: | 里德愛思唯爾股份有限公司雷克薩斯尼克薩斯分公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/93;G06F40/205;G06Q50/18;G06F40/279 |
| 代理公司: | 上海專利商標事務(wù)所有限公司 31100 | 代理人: | 李玲 |
| 地址: | 美國俄*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 自動 標識 文檔 中的 潛在 重要 事實 系統(tǒng) 方法 | ||
1.一種用于標識從電子儲存庫獲得的電子法律文檔中的潛在重要事實語句的系統(tǒng),所述系統(tǒng)包括:
處理設(shè)備;以及
非瞬態(tài)處理器可讀存儲介質(zhì),其與所述處理設(shè)備通信,所述非瞬態(tài)處理器可讀存儲介質(zhì)包括一個或多個編程指令,所述一個或多個編程指令當(dāng)被執(zhí)行時致使所述處理器設(shè)備:
從儲存庫獲得電子法律文檔,
解析所述電子法律文檔內(nèi)的文本以基于與所述法律文檔中的一個或多個段落中的每一個段落相關(guān)聯(lián)的標題以及所述每一個段落的一個或多個特征中的至少一項判定所述每一個段落是事實段落、討論段落還是結(jié)果段落,以及
針對所述一個或多個段落中作為事實段落的每一個段落:
提取所述事實段落中的一個或多個語句中的每一個語句,
指示受訓(xùn)語句分類器基于所述一個或多個語句中的每一個語句的一個或多個特征來判定所述每一個語句是潛在重要事實語句還是非重要事實語句,其中:
判定所述潛在重要事實語句包括判定語句潛在地包含重要事實在其中,
判定所述非重要事實語句包括判定語句不包含重要事實,以及
所述重要事實是與所述電子法律文檔的特定主題有密切關(guān)系的事實;以及
基于判定從所述一個或多個語句標識一個或多個潛在重要事實語句。
2.如權(quán)利要求1所述的系統(tǒng),其中,所述每一個語句的所述一個或多個特征選自由以下各項組成的組:名詞短語的數(shù)量、動詞短語的數(shù)量、日期的數(shù)量、時間戳的數(shù)量、貨幣值的數(shù)量、下級法院行為的數(shù)量、當(dāng)前法院行為的數(shù)量、原告行為的數(shù)量、法律短語的數(shù)量、法律概念的數(shù)量、非重要事實單詞的數(shù)量以及非重要事實短語的數(shù)量。
3.如權(quán)利要求1所述的系統(tǒng),其中,所述受訓(xùn)語句分類器通過對所述一個或多個語句中的每一個語句運行自然語言解析器來判定所述一個或多個語句中的每一個語句是潛在重要事實語句還是非重要事實語句從而確定所述每一個語句的所述一個或多個特征。
4.如權(quán)利要求1所述的系統(tǒng),其中,所述受訓(xùn)語句分類器通過基于支撐向量機算法從訓(xùn)練數(shù)據(jù)中生成的受訓(xùn)模型對所述一個或多個特征打分來判定所述一個或多個語句中的每一個語句是潛在重要事實語句還是非重要事實語句。
5.如權(quán)利要求1所述的系統(tǒng),其中,所述受訓(xùn)語句分類器通過基于決策樹算法從訓(xùn)練數(shù)據(jù)中生成的受訓(xùn)模型對所述一個或多個特征打分來判定所述一個或多個語句中的每一個語句是潛在重要事實語句還是非重要事實語句。
6.如權(quán)利要求1所述的系統(tǒng),其中,所述受訓(xùn)語句分類器通過基于樸素貝葉斯算法從訓(xùn)練數(shù)據(jù)中生成的受訓(xùn)模型對所述一個或多個特征打分來判定所述一個或多個語句中的每一個語句是潛在重要事實語句還是非重要事實語句。
7.如權(quán)利要求1所述的系統(tǒng),其中,所述受訓(xùn)語句分類器通過基于一組堆疊分類器算法從訓(xùn)練數(shù)據(jù)中生成的受訓(xùn)模型以及從一個或多個基分類器輸出的數(shù)據(jù)對所述一個或多個特征打分來判定所述一個或多個語句中的每一個語句是潛在重要事實語句還是非重要事實語句。
8.如權(quán)利要求1所述的系統(tǒng),其中,所述標題是事實標題、討論標題或結(jié)果標題。
9.如權(quán)利要求1所述的系統(tǒng),其中,所述段落的所述一個或多個特征選自由以下各項組成的組:所述段落的位置、案例的數(shù)量、法規(guī)的數(shù)量、過去時態(tài)動詞的數(shù)量、當(dāng)前法院單詞的數(shù)量、下級法院單詞的數(shù)量、法律短語的數(shù)量、被告單詞的數(shù)量、原告單詞的數(shù)量、日期的數(shù)量、信號單詞的數(shù)量以及注腳的數(shù)量。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于里德愛思唯爾股份有限公司雷克薩斯尼克薩斯分公司,未經(jīng)里德愛思唯爾股份有限公司雷克薩斯尼克薩斯分公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201580063042.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:手機支架(1)
- 下一篇:冰箱(兩門?B17001)





