[發(fā)明專利]一種政務(wù)電子文檔的內(nèi)容分析提取系統(tǒng)在審
| 申請?zhí)枺?/td> | 202010002755.0 | 申請日: | 2020-01-02 |
| 公開(公告)號: | CN111178057A | 公開(公告)日: | 2020-05-19 |
| 發(fā)明(設(shè)計(jì))人: | 王知明;李杰 | 申請(專利權(quán))人: | 大漢軟件股份有限公司 |
| 主分類號: | G06F40/279 | 分類號: | G06F40/279 |
| 代理公司: | 江蘇法德東恒律師事務(wù)所 32305 | 代理人: | 劉林 |
| 地址: | 210000 江蘇省南京市*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 政務(wù) 電子 文檔 內(nèi)容 分析 提取 系統(tǒng) | ||
1.一種政務(wù)電子文檔的內(nèi)容分析提取系統(tǒng),其特征在于,可以實(shí)現(xiàn)兩個(gè)目的,分別如下:
(1)、提供對各種電子文檔的內(nèi)容抽取和html、asp、jsp、php等頁面內(nèi)容提取,同時(shí)提供對內(nèi)容的關(guān)鍵要素進(jìn)行提取,例如對于政務(wù)新聞提取標(biāo)題、內(nèi)容、時(shí)間、作者;對于政府信息公開除了提取新聞的要素外還提取索引號、文號、信息分類、發(fā)布機(jī)構(gòu),支持按需擴(kuò)展自定義要素的規(guī)則;
(2)、提供并接受多種渠道的文檔內(nèi)容分析提取請求,并提供異步處理方案使系統(tǒng)之間解耦。
2.如權(quán)利要求1所述的一種政務(wù)電子文檔的內(nèi)容分析提取系統(tǒng),其特征在于,所述目的(1)的技術(shù)方案如下:
a、接收文件;
b、判斷傳來的文件類型;
c、使用對應(yīng)文件類型的內(nèi)容抽取模塊來讀取整個(gè)文件內(nèi)容;
d、對于電子文檔繼續(xù)抽取文件的Metadata;
e、對于網(wǎng)頁文件抽取頁面的head中的title、meta;
f、對于電子文檔需要使用特征來分析內(nèi)容;
g、對于網(wǎng)頁需要使用密度以及規(guī)則來分析內(nèi)容;
h、將結(jié)果封裝成統(tǒng)一格式返回。
3.如權(quán)利要求1所述的一種政務(wù)電子文檔的內(nèi)容分析提取系統(tǒng),其特征在于,所述目的(2)的技術(shù)方案如下:
同步:提供REST接口,對接系統(tǒng)可以POST文件或者URL地址,系統(tǒng)接收后同步處理將提取結(jié)果返回,期間對接系統(tǒng)需要等待;
異步:提供使用消息中間件的交互方式,對接系統(tǒng)將需要處理的文件或者URL發(fā)送給消息中間件,由消息中間件發(fā)送給文檔內(nèi)容分析提取系統(tǒng),系統(tǒng)處理完畢后將結(jié)果返回給消息中間件,對接系統(tǒng)通過接收消息來處理結(jié)果,期間對接系統(tǒng)可以不用等待提取系統(tǒng)的結(jié)果反饋。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于大漢軟件股份有限公司,未經(jīng)大漢軟件股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010002755.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于共治網(wǎng)格的政務(wù)信息處理方法和裝置
- 一種輕政務(wù)服務(wù)和政務(wù)新媒體的軟件即服務(wù)方法及SaaS平臺
- 一種電子政務(wù)系統(tǒng)網(wǎng)絡(luò)感知分析平臺系統(tǒng)
- 政務(wù)信息的處理方法、裝置和計(jì)算機(jī)可讀存儲介質(zhì)
- 政務(wù)信息管理方法
- 基于大數(shù)據(jù)的智慧政務(wù)請求處理方法
- 一種智慧政務(wù)請求處理方法
- 基于大數(shù)據(jù)的智慧政務(wù)云平臺
- 政務(wù)事項(xiàng)處理方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種基于互聯(lián)網(wǎng)的政務(wù)服務(wù)系統(tǒng)及其使用方法
- 一種在多種電子設(shè)備,尤其是在電子服務(wù)提供商的電子設(shè)備和電子服務(wù)用戶的電子設(shè)備之間建立受保護(hù)的電子通信的方法
- 一種電子打火機(jī)及其裝配方法
- 電子檔案管理系統(tǒng)
- 在處理系統(tǒng)化學(xué)分析中使用的電子束激勵(lì)器
- 電子文件管理方法和管理系統(tǒng)
- 一種有效電子憑據(jù)生成、公開驗(yàn)證方法、裝置及系統(tǒng)
- 電子文憑讀寫控制系統(tǒng)和方法
- 具有加密解密功能的智能化電子證件管理裝置
- 一種基于數(shù)字證書的電子印章方法及電子印章系統(tǒng)
- 一種電子印章使用方法、裝置及電子設(shè)備
- 內(nèi)容再現(xiàn)系統(tǒng)、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容提供裝置、內(nèi)容再現(xiàn)程序和內(nèi)容提供程序
- 內(nèi)容記錄系統(tǒng)、內(nèi)容記錄方法、內(nèi)容記錄設(shè)備和內(nèi)容接收設(shè)備
- 內(nèi)容服務(wù)系統(tǒng)、內(nèi)容服務(wù)器、內(nèi)容終端及內(nèi)容服務(wù)方法
- 內(nèi)容分發(fā)系統(tǒng)、內(nèi)容分發(fā)裝置、內(nèi)容再生終端及內(nèi)容分發(fā)方法
- 內(nèi)容發(fā)布、內(nèi)容獲取的方法、內(nèi)容發(fā)布裝置及內(nèi)容傳播系統(tǒng)
- 內(nèi)容提供裝置、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法
- 內(nèi)容傳輸設(shè)備、內(nèi)容傳輸方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容發(fā)送設(shè)備、內(nèi)容發(fā)送方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法、內(nèi)容再現(xiàn)程序及內(nèi)容提供系統(tǒng)
- 內(nèi)容記錄裝置、內(nèi)容編輯裝置、內(nèi)容再生裝置、內(nèi)容記錄方法、內(nèi)容編輯方法、以及內(nèi)容再生方法





