[發明專利]政策文件數據處理方法及裝置在審
| 申請號: | 202110332101.9 | 申請日: | 2021-03-29 |
| 公開(公告)號: | CN113076417A | 公開(公告)日: | 2021-07-06 |
| 發明(設計)人: | 王騰 | 申請(專利權)人: | 中國建設銀行股份有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/31;G06F16/33;G06F16/25;G06F16/28;G06F16/951 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 賈磊;李輝 |
| 地址: | 100033 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 政策 文件 數據處理 方法 裝置 | ||
1.一種政策文件數據處理方法,其特征在于,包括:
獲取政策文件數據;
將所述政策文件數據,輸入到預先訓練好的政策梳理模型中,輸出所述政策文件數據對應的政策元素分類;
將所述政策文件數據和對應的政策元素分類進行關聯存儲。
2.如權利要求1所述的方法,其特征在于,在將所述政策文件數據,輸入到預先訓練好的政策梳理模型中,輸出所述政策文件數據對應的政策元素分類之前,所述方法還包括:
獲取已標注政策元素分類的政策文件數據;
根據已標注政策元素分類的政策文件數據,訓練所述政策梳理模型。
4.如權利要求1所述的方法,其特征在于,將所述政策文件數據和對應的政策元素分類進行關聯存儲,包括:
將所述政策文件數據和對應的政策元素分類,關聯存儲到檢索數據庫中。
5.如權利要求4所述的方法,其特征在于,所述檢索數據庫包括:關系型數據庫和非關系型數據庫。
6.如權利要求5所述的方法,其特征在于,所述關系型數據庫為MySql數據庫;所述非關系型數據庫為Redis數據庫。
7.如權利要求4所述的方法,其特征在于,在將所述政策文件數據和對應的政策元素分類,關聯存儲到檢索數據庫中之后,所述方法還包括:
接收政策文件數據查詢請求,其中,所述政策文件數據查詢請求中包含:待查詢政策文件數據對應的政策元素分類;
根據政策文件數據查詢請求,從所述檢索數據庫中查詢對應政策元素分類的政策文件數據。
8.如權利要求4所述的方法,其特征在于,在將所述政策文件數據和對應的政策元素分類,關聯存儲到檢索數據庫中之后,所述方法還包括:
采集客戶端的用戶行為數據,其中,所述用戶行為數據包含:客戶端用戶關注的政策元素分類;
基于所述檢索數據庫,根據所述客戶端的用戶行為數據,向客戶端推送客戶端用戶關注的政策元素分類的政策文件數據。
9.如權利要求1所述的方法,其特征在于,所述方法還包括:
統計政策文件數據的發布和實施情況;
根據統計結果,確定政策文件數據的執行結果。
10.如權利要求1至7任一項所述的方法,其特征在于,所述政策元素包括:主題分類、行業分類、政策受眾、政策層級、政策專題。
11.一種政策文件數據處理裝置,其特征在于,包括:
政策文件獲取模塊,用于獲取政策文件數據;
政策元素分類模塊,用于將所述政策文件數據,輸入到預先訓練好的政策梳理模型中,輸出所述政策文件數據對應的政策元素分類;
政策文件分類存儲模塊,用于將所述政策文件數據和對應的政策元素分類進行關聯存儲。
12.如權利要求11所述的裝置,其特征在于,所述裝置還包括:
機器學習模塊,用于獲取已標注政策元素分類的政策文件數據;以及根據已標注政策元素分類的政策文件數據,訓練所述政策梳理模型。
13.如權利要求11所述的裝置,其特征在于,所述政策文件獲取模塊包括:
數據爬取單元,用于爬取政務網站發布的政策文件數據;
數據批量導入單元,用于批量導入政策文件數據;
系統對接單元,用于與政策發布平臺的系統對接,獲取政策文件數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國建設銀行股份有限公司,未經中國建設銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110332101.9/1.html,轉載請聲明來源鉆瓜專利網。





