[發明專利]政策文本關聯性分析方法及系統在審
| 申請號: | 202011469998.1 | 申請日: | 2020-12-15 |
| 公開(公告)號: | CN112580348A | 公開(公告)日: | 2021-03-30 |
| 發明(設計)人: | 孫璐;李向前;劉巍;雷吉成;許卡;巢文涵;郝雅琦;張金言 | 申請(專利權)人: | 國家工業信息安全發展研究中心;中電科大數據研究院有限公司;中譯語通科技股份有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/30;G06F40/211;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京中譽威圣知識產權代理有限公司 11279 | 代理人: | 李澤中 |
| 地址: | 100040 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 政策 文本 關聯性 分析 方法 系統 | ||
1.一種政策文本關聯性分析方法,其特征在于,包括:
獲取待進行關聯性分析的兩個政策文本;
判斷兩個所述政策文本之間是否具有上下級關系,若是,則將不同的所述政策文本中的任意兩個屬性相同的單句組成一個單句對,得到若干所述單句對;
對于每一所述單句對,判斷所述單句對中的兩個所述單句是否相似,若是,則根據兩個所述單句所屬的政策文本類別,確定兩個所述單句之間的關聯關系并作為所述單句對對應的關聯關系;
根據若干所述單句對對應的若干關聯關系,確定兩個所述政策文本之間的關聯關系。
2.根據權利要求1所述的政策文本關聯性分析方法,其特征在于,判斷兩個所述政策文本之間是否具有上下級關系,包括:
判斷兩個所述政策文本是否屬于同一領域;
若是,則判斷兩個所述政策文本是否由相同的機構發布;
若是,則判斷兩個所述政策文本具有上下級關系;若否,則判斷兩個所述政策文本是否分別由中央發布和由地方發布;
若是,則判斷兩個所述政策文本具有上下級關系;若否,則判斷兩個所述政策文本是否分別由上級機構發布和由下級機構發布;
若是,則判斷兩個所述政策文本具有上下級關系。
3.根據權利要求1所述的政策文本關聯性分析方法,其特征在于,將不同的所述政策文本中的任意兩個屬性相同的單句組成一個單句對,之前還包括:
對于兩個所述政策文本中的每一所述單句,將所述單句輸入至訓練后的神經網絡模型,獲取訓練后的所述神經網絡模型輸出的所述單句所屬的政策文本類別和所述單句的屬性;
其中,訓練后的所述神經網絡模型基于訓練集訓練得到,所述訓練集包括若干樣本單句和每一所述樣本單句所屬的樣本政策文本類別和每一所述樣本單句的樣本屬性。
4.根據權利要求3所述的政策文本關聯性分析方法,其特征在于,所述神經網絡模型為BERT模型。
5.根據權利要求1所述的政策文本關聯性分析方法,其特征在于,判斷所述單句對中的兩個所述單句是否相似,包括:
對所述單句對中的兩個所述單句分別進行句法分析,提取每一所述單句中的動詞和對應的名詞,若兩個所述單句的所述動詞匹配且所述名詞匹配,則判斷兩個所述單句相似。
6.根據權利要求1所述的政策文本關聯性分析方法,其特征在于,判斷所述單句對中的兩個所述單句是否相似,包括:
采用bleu1或word2vec句向量計算兩個所述單句之間的相似度,若所述相似度大于預設閾值,則判斷兩個所述單句相似。
7.根據權利要求1所述的政策文本關聯性分析方法,其特征在于,根據若干所述單句對對應的若干關聯關系,確定兩個所述政策文本之間的關聯關系,包括:
將若干所述單句對對應的若干關聯關系進行類別劃分,得到若干關聯關系組;其中,同一所述關聯關系組中的關聯關系均相同,不同的所述關聯關系組中的關聯關系均不同;
統計每一所述關聯關系組中的關聯關系的數量,將關聯關系的數量最多的所述關聯關系組中的任一關聯關系作為兩個所述政策文本之間的關聯關系。
8.一種政策文本關聯性分析系統,其特征在于,包括:
政策文本獲取模塊,用于獲取待進行關聯性分析的兩個政策文本;
單句對獲取模塊,用于判斷兩個所述政策文本之間是否具有上下級關系,若是,則將不同的所述政策文本中的任意兩個屬性相同的單句組成一個單句對,得到若干所述單句對;
單句關聯關系獲取模塊,用于對于每一所述單句對,判斷所述單句對中的兩個所述單句是否相似,若是,則根據兩個所述單句所屬的政策文本類別,確定兩個所述單句之間的關聯關系并作為所述單句對對應的關聯關系;
政策文本關聯關系獲取模塊,用于根據若干所述單句對對應的若干關聯關系,確定兩個所述政策文本之間的關聯關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家工業信息安全發展研究中心;中電科大數據研究院有限公司;中譯語通科技股份有限公司,未經國家工業信息安全發展研究中心;中電科大數據研究院有限公司;中譯語通科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011469998.1/1.html,轉載請聲明來源鉆瓜專利網。





