[發(fā)明專利]一種案件語義要素的自動抽取方法在審
| 申請?zhí)枺?/td> | 201711332273.6 | 申請日: | 2017-12-13 |
| 公開(公告)號: | CN107894981A | 公開(公告)日: | 2018-04-10 |
| 發(fā)明(設(shè)計)人: | 金勇;邱爽;李力;陳云浩;朱陽光 | 申請(專利權(quán))人: | 武漢烽火普天信息技術(shù)有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 上海精晟知識產(chǎn)權(quán)代理有限公司31253 | 代理人: | 馮子玲 |
| 地址: | 430000 湖北*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 案件 語義 要素 自動 抽取 方法 | ||
1.一種案件語義要素的自動抽取方法,其特征在于,包括如下步驟:
S1、首先根據(jù)要素可能出現(xiàn)的詞性,利用預(yù)先訓(xùn)練好的序列標注模對簡要案情的進行詞性標注,識別出里面的名詞,動詞和動名詞;
S2、作案工具和涉案物品從名詞中抽取,人工進行分類標注少數(shù)簡要案情中的作案工具和涉案物品;作案手段從動詞和動名詞中抽取,并且還需要識別作案手段動詞和名詞的結(jié)合,最終形成種子詞庫;
S3、根據(jù)人工標注的種子詞庫,利用詞義相似算法找到更多相類似的詞,以便豐富詞庫;由于詞性標注是基于已有的簡要案情進行的,為了之后新增案件語義要素抽取可以獲得較高的準確率,利用相似算法獲取相似詞是十分必要的;
S4、利用校對的詞庫結(jié)合已訓(xùn)練好的序列標注模型對所有案件的簡要案情進行相關(guān)要素的抽取,對抽取的要素進行進一步調(diào)優(yōu);
S5、要素按類別形成類別詞庫,結(jié)合序列標注算法和正則化處理方法,對新輸入的簡要案情文本進行自動抽取,將抽取的語義要素對應(yīng)案件編號入庫。
2.根據(jù)權(quán)利要求1所述的一種案件語義要素的自動抽取方法,其特征在于:在S3中,種子詞庫可以采用作案工具,涉案物品、作案手段、侵害對象、選擇場所等。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢烽火普天信息技術(shù)有限公司,未經(jīng)武漢烽火普天信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711332273.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





