[發(fā)明專利]一種法律文書的分段方法及裝置有效
| 申請?zhí)枺?/td> | 201710081315.7 | 申請日: | 2017-02-15 |
| 公開(公告)號: | CN108427667B | 公開(公告)日: | 2021-08-10 |
| 發(fā)明(設(shè)計)人: | 石鵬;魏康 | 申請(專利權(quán))人: | 北京國雙科技有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/216;G06Q50/18 |
| 代理公司: | 北京鼎佳達(dá)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11348 | 代理人: | 王偉鋒;劉鐵生 |
| 地址: | 100083 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 法律文書 分段 方法 裝置 | ||
1.一種法律文書的分段方法,其特征在于,包括:
提取法律文書的語義特征;
設(shè)置所述語義特征屬于不同語義段的權(quán)重值;
根據(jù)所述法律文書中每個自然段所包含的語義特征以及所述語義特征屬于不同語義段的權(quán)重值,得到所述法律文書中每個自然段屬于不同語義段的概率值;
采用動態(tài)規(guī)劃算法從所述概率值中選取分段組合概率最大值對應(yīng)的分段路徑作為所述法律文書的分段路徑;
在所述提取法律文書的語義特征之前,還包括:
利用法律文書樣本中的文書結(jié)構(gòu)歸納語義段集合,所述語義段集合中包含用于表征法律文書中不同主題內(nèi)容的多個語義段。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述法律文書中每個自然段所包含的語義特征以及所述語義特征屬于不同語義段的權(quán)重值,得到所述法律文書中每個自然段屬于不同語義段的概率值包括:
統(tǒng)計所述法律文書中每個自然段所包含的語義特征,得到每個語義特征出現(xiàn)在不同自然段的頻率;
根據(jù)所述每個語義特征出現(xiàn)在不同自然段的頻率以及該語義特征屬于不同語義段的權(quán)重值,得到所述法律文書中每個自然段屬于不同語義段的概率值。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述采用動態(tài)規(guī)劃算法從所述概率值中選取分段組合概率最大值對應(yīng)的分段路徑作為所述法律文書的分段路徑包括:
根據(jù)所述每個自然段屬于不同語義段的概率值,得到概率值矩陣;
將所述概率矩陣作為輸入?yún)?shù),采用動態(tài)規(guī)劃算法計算分段組合概率;
選取所述分段組合概率最大值對應(yīng)的分段路徑作為所述法律文書的分段路徑。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述設(shè)置所述語義特征屬于不同語義段的權(quán)重值包括:
根據(jù)統(tǒng)計語義特征在不同語義段出現(xiàn)的歷史次數(shù),設(shè)置所述語義特征屬于不同語義段的權(quán)重值。
5.一種法律文書的分段裝置,其特征在于,包括:
提取單元,用于提取法律文書的語義特征;
設(shè)置單元,用于設(shè)置所述語義特征屬于不同語義段的權(quán)重值;
概率計算單元,用于根據(jù)所述法律文書中每個自然段所包含的語義特征以及所述語義特征屬于不同語義段的權(quán)重值,得到所述法律文書中每個自然段屬于不同語義段的概率值;
選取單元,用于采用動態(tài)規(guī)劃算法從所述概率值中選取分段組合概率最大值對應(yīng)的分段路徑作為所述法律文書的分段路徑;
還包括:
歸納單元,用于利用法律文書樣本中的文書結(jié)構(gòu)歸納語義段集合,所述語義段集合中包含用于表征法律文書中不同主題內(nèi)容的多個語義段。
6.根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述概率計算單元包括:
統(tǒng)計模塊,用于統(tǒng)計所述法律文書中每個自然段所包含的語義特征,得到每個語義特征出現(xiàn)在不同自然段的頻率;
第一計算模塊,用于根據(jù)所述每個語義特征出現(xiàn)在不同自然段的頻率以及該語義特征屬于不同語義段的權(quán)重值,得到所述法律文書中每個自然段屬于不同語義段的概率值。
7.根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述選取單元包括:
第二計算模塊,用于根據(jù)所述每個自然段屬于不同語義段的概率值,得到概率值矩陣;
第三計算模塊,用于將所述概率矩陣作為輸入?yún)?shù),采用動態(tài)規(guī)劃算法計算分段組合概率;
選取模塊,用于選取所述分段組合概率最大值對應(yīng)的分段路徑作為所述法律文書的分段路徑。
8.根據(jù)權(quán)利要求5所述的裝置,其特征在于,
所述設(shè)置單元,具體用于根據(jù)統(tǒng)計語義特征在不同語義段出現(xiàn)的歷史次數(shù),設(shè)置所述語義特征屬于不同語義段的權(quán)重值。
9.一種存儲介質(zhì),其特征在于,所述存儲介質(zhì)包括存儲的程序,其中,在所述程序運行時控制所述存儲介質(zhì)所在設(shè)備執(zhí)行權(quán)利要求1至權(quán)利要求4中任意一項所述的法律文書的分段方法。
10.一種處理器,其特征在于,所述處理器用于運行程序,其中,所述程序運行時執(zhí)行權(quán)利要求1至權(quán)利要求4中任意一項所述的法律文書的分段方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京國雙科技有限公司,未經(jīng)北京國雙科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710081315.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





