[發(fā)明專利]基于法律數(shù)據(jù)的知識(shí)圖譜構(gòu)建方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201711006520.3 | 申請(qǐng)日: | 2017-10-25 |
| 公開(公告)號(hào): | CN107908671B | 公開(公告)日: | 2022-02-01 |
| 發(fā)明(設(shè)計(jì))人: | 杜向陽;梁雁圓 | 申請(qǐng)(專利權(quán))人: | 南京擎盾信息科技有限公司;杜向陽;梁雁圓 |
| 主分類號(hào): | G06F16/36 | 分類號(hào): | G06F16/36;G06Q50/18 |
| 代理公司: | 南京眾聯(lián)專利代理有限公司 32206 | 代理人: | 葉涓涓 |
| 地址: | 210000 江蘇省南京市雨*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 法律 數(shù)據(jù) 知識(shí) 圖譜 構(gòu)建 方法 系統(tǒng) | ||
本發(fā)明提供了基于法律數(shù)據(jù)的知識(shí)圖譜構(gòu)建方法及系統(tǒng),方法包括:構(gòu)建法律詞典步驟,提取法律短語步驟,預(yù)處理法律文本步驟,初步構(gòu)建法律知識(shí)步驟,識(shí)別法律實(shí)體步驟,識(shí)別法律關(guān)系步驟,構(gòu)造法律知識(shí)鏈步驟;系統(tǒng)包括法律基礎(chǔ)詞典構(gòu)建模塊、法律基礎(chǔ)知識(shí)庫構(gòu)建模塊、法律實(shí)體自動(dòng)識(shí)別模塊、法律關(guān)系自動(dòng)識(shí)別模塊、法律知識(shí)鏈自動(dòng)生成模塊。本發(fā)明實(shí)現(xiàn)了針對(duì)法律數(shù)據(jù)構(gòu)建知識(shí)圖譜,能夠在多個(gè)法律案由,如離婚糾紛、合同糾紛和機(jī)動(dòng)車交通事故責(zé)任糾紛等案由數(shù)據(jù)構(gòu)建知識(shí)圖譜,為法律行業(yè)的上層應(yīng)用提供了走向智能化的數(shù)據(jù)。
技術(shù)領(lǐng)域
本發(fā)明屬于數(shù)據(jù)處理技術(shù)領(lǐng)域,涉及一種法律數(shù)據(jù)的知識(shí)圖譜構(gòu)建方法及能夠?qū)崿F(xiàn)該方法的系統(tǒng)。
背景技術(shù)
人工智能正在我們?nèi)祟惖纳钪邪l(fā)揮越來越重要的價(jià)值——它們正在接管我們的工作、幫助我們更高效更安全地生產(chǎn)、甚至改變我們生存與存在的方式。2010年以來,人工智能技術(shù)陸續(xù)在谷歌、Facebook、百度等頂尖互聯(lián)網(wǎng)公司獲得廣泛應(yīng)用;2016年,谷歌的戰(zhàn)略重心從“移動(dòng)先行”全面轉(zhuǎn)向“人工智能先行”;根據(jù)埃森哲預(yù)測(cè),到2035年時(shí),人工智能可將12個(gè)發(fā)達(dá)經(jīng)濟(jì)體的年經(jīng)濟(jì)增長率提升一倍;2016年下半年,美國白宮科技政策辦公室連續(xù)發(fā)布人工智能戰(zhàn)略規(guī)劃和研究報(bào)告,呼吁美國政府關(guān)注人工智能相關(guān)的科研、教育、產(chǎn)業(yè)發(fā)展及可能引發(fā)的就業(yè)和經(jīng)濟(jì)問題。2017年3月,人工智能首次寫入我國的政府工作報(bào)告。人工智能技術(shù)將走出實(shí)驗(yàn)室,與相關(guān)產(chǎn)業(yè)進(jìn)行更緊密銜接。而法律行業(yè)是人工智能應(yīng)用的最熱門領(lǐng)域之一。
人工智能和法律的結(jié)合是法律行業(yè)發(fā)展的必然方向,重點(diǎn)是根據(jù)相關(guān)技術(shù)方法建立基于法律知識(shí)和案例的推理模型或知識(shí)系統(tǒng)等應(yīng)用。法律人工智能的核心難點(diǎn)在于如何讓計(jì)算機(jī)表示和理解法律知識(shí),知識(shí)圖譜是解決這個(gè)難題的技術(shù),它是機(jī)器大腦中的知識(shí)庫。同時(shí),法律知識(shí)圖譜是人類和機(jī)器的橋梁,描述了法律客觀世界的概念、實(shí)體、事件及其之間的關(guān)系,是法律知識(shí)人機(jī)交互的基礎(chǔ)。
谷歌于2012年5月推出谷歌知識(shí)圖譜,并利用其在搜索引擎中增強(qiáng)搜索結(jié)果,標(biāo)志著大規(guī)模知識(shí)圖譜在互聯(lián)網(wǎng)語義搜索中的成功應(yīng)用。在研究領(lǐng)域,知識(shí)圖譜也取得了顯著的成果,主要是根據(jù)FreeBase或ConceptNet5等已有的數(shù)據(jù),推動(dòng)了研究的發(fā)展。然而在法律行業(yè),尚未出現(xiàn)基于法律知識(shí)圖譜較成功的應(yīng)用,原因在于真實(shí)的法律知識(shí)圖譜構(gòu)建的難度。主要存在的問題包括:
1)數(shù)據(jù)孤島問題,法律行業(yè)在互聯(lián)網(wǎng)的背景下也呈現(xiàn)出了大數(shù)據(jù)的特點(diǎn),相關(guān)的法律數(shù)據(jù)包括法律法規(guī)、司法解釋、裁判文書等。而各個(gè)數(shù)據(jù)往往都各自存儲(chǔ),各自定義,數(shù)據(jù)之間無法聯(lián)動(dòng),彼此無法兼容。
2)知識(shí)缺失問題,法律行業(yè)的數(shù)據(jù)仍然是以非結(jié)構(gòu)化的文本為主,缺乏具有知識(shí)結(jié)構(gòu)且計(jì)算機(jī)能夠理解的知識(shí)數(shù)據(jù)。
3)認(rèn)知鴻溝問題,法律知識(shí)圖譜不等同于傳統(tǒng)的知識(shí)圖譜,普通的知識(shí)圖譜的構(gòu)建方法對(duì)法律數(shù)據(jù)不完全適應(yīng),法律實(shí)體和法律關(guān)系都需要法律專家的介入,對(duì)實(shí)體和關(guān)系做法律上的專業(yè)定義。
4)構(gòu)建體系問題,法律知識(shí)圖譜沒有一個(gè)統(tǒng)一規(guī)范的構(gòu)建流程和體系,缺乏自動(dòng)化的輔助工具。
因此目前尚無技術(shù)能夠?qū)崿F(xiàn)法律知識(shí)圖譜的構(gòu)建。
發(fā)明內(nèi)容
為解決上述問題,本發(fā)明在深入研究法律知識(shí)圖譜相關(guān)理論和技術(shù)的基礎(chǔ)上,提出了一種融合法律專家知識(shí)和人工智能技術(shù)的法律知識(shí)圖譜構(gòu)建方法及系統(tǒng),以解決現(xiàn)有技術(shù)中構(gòu)建法律知識(shí)圖譜方法中,所具有的詞匯歧義、關(guān)聯(lián)查詢、數(shù)據(jù)集成、知識(shí)推理等問題,填補(bǔ)了針對(duì)法律數(shù)據(jù)自動(dòng)化構(gòu)建知識(shí)圖譜的空白。為了達(dá)到上述目的,本發(fā)明提供如下技術(shù)方案:
基于法律數(shù)據(jù)的知識(shí)圖譜構(gòu)建方法,包括如下步驟:
步驟1,構(gòu)建法律詞典
首先下載以及人工標(biāo)注法律種子詞庫,同時(shí)訓(xùn)練法律文本語料得到法律詞向量;然后計(jì)算與詞向量相似的候選法律詞,計(jì)算相似度公式為:其中W1,W2為法律詞匯的詞向量;最后篩選有效的候選法律詞;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京擎盾信息科技有限公司;杜向陽;梁雁圓,未經(jīng)南京擎盾信息科技有限公司;杜向陽;梁雁圓許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711006520.3/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 法律文件翻譯對(duì)照方法
- 一種法律信息查詢的方法和裝置
- 基于法律數(shù)據(jù)的知識(shí)圖譜構(gòu)建方法及系統(tǒng)
- 一種法律文書與法律法規(guī)對(duì)應(yīng)性檢索方法
- 法律信息推薦方法及裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種面向法律領(lǐng)域的動(dòng)態(tài)法律事件圖譜構(gòu)建方法
- 信息處理方法及裝置
- 一種基于信息抽取的法律知識(shí)圖譜構(gòu)建方法
- 一種基于網(wǎng)絡(luò)表示學(xué)習(xí)的相似案例推薦方法
- 一種法律知識(shí)圖譜構(gòu)建系統(tǒng)及方法
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 基于本體的知識(shí)地圖繪制系統(tǒng)
- 基于知識(shí)地圖的領(lǐng)域知識(shí)瀏覽方法
- 一種基于知識(shí)本體的知識(shí)體系的建模方法
- 一種知識(shí)工程系統(tǒng)
- 知識(shí)自動(dòng)化系統(tǒng)和方法以及存儲(chǔ)器
- 基于SOLR的知識(shí)管理系統(tǒng)
- 基于知識(shí)節(jié)點(diǎn)所屬度的知識(shí)圖譜構(gòu)建方法和裝置
- 一種基于知識(shí)圖譜的稅務(wù)知識(shí)庫系統(tǒng)
- 一種智聯(lián)網(wǎng)中的網(wǎng)絡(luò)知識(shí)統(tǒng)一表征架構(gòu)及實(shí)現(xiàn)方法
- 知識(shí)點(diǎn)存儲(chǔ)方法、裝置、服務(wù)器及介質(zhì)





