[發(fā)明專利]一種智能分析文檔的方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201710555508.1 | 申請(qǐng)日: | 2017-07-10 |
| 公開(kāi)(公告)號(hào): | CN107315830A | 公開(kāi)(公告)日: | 2017-11-03 |
| 發(fā)明(設(shè)計(jì))人: | 羅文;陳業(yè)英 | 申請(qǐng)(專利權(quán))人: | 深圳市視維科技股份有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30;H04L29/08 |
| 代理公司: | 深圳市深聯(lián)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙)44357 | 代理人: | 楊靜 |
| 地址: | 518000 廣東省深圳市*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 智能 分析 文檔 方法 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)應(yīng)用技術(shù),尤其涉及一種智能分析文檔的方法。
背景技術(shù)
隨著科學(xué)技術(shù)的不斷發(fā)展,人們從以前的紙質(zhì)書(shū)籍已經(jīng)慢慢的演變?yōu)殡娮訒?shū),隨著各種資料、書(shū)籍、文檔的增加,人們?cè)趯ふ疫m合自己需要的文件時(shí),往往會(huì)需要花費(fèi)大量的時(shí)間來(lái)整理和翻閱,費(fèi)時(shí)費(fèi)力,效果不佳,這樣人們的實(shí)際價(jià)值將得不到具體的體現(xiàn)。所以,急需要一種方法,來(lái)幫助人們提高效率,把整理資料和檢索有用信息的事情交給它去做。
發(fā)明內(nèi)容
為解決現(xiàn)有技術(shù)中的問(wèn)題,本發(fā)明提供一種智能分析文檔的方法,還提供了一種實(shí)現(xiàn)所述方法的系統(tǒng)。
本發(fā)明方法包括如下步驟:
S1:用戶通過(guò)客戶端上傳需要分析的文檔及分析條件;
S2:客戶端通過(guò)四層模型將文檔信息封裝成比特流的形式,然后通過(guò)路由器上傳至服務(wù)器;
S3:服務(wù)器解封裝,得到原始文檔信息;
S4:服務(wù)器通過(guò)算法進(jìn)行數(shù)據(jù)分析,和大數(shù)據(jù)分析統(tǒng)計(jì),獲取文檔的相關(guān)信息,并將分析結(jié)果存儲(chǔ)至數(shù)據(jù)庫(kù);
S5:服務(wù)器將獲取的分析結(jié)果返回給用戶。
本發(fā)明作進(jìn)一步改進(jìn),步驟S1中,如果為電子文檔,所述客戶端包括PC電腦、平板、手機(jī),如果為紙質(zhì)文檔,所述客戶端還包括掃描儀,所述掃描儀將紙質(zhì)文檔轉(zhuǎn)換為電子文檔上傳至服務(wù)器。
本發(fā)明作進(jìn)一步改進(jìn),在步驟S2中,所述四層模型包括應(yīng)用層、傳輸層、網(wǎng)絡(luò)互聯(lián)層和物理層,所述文檔處理方法包括:
S21:在應(yīng)用層,所述文檔信息將文檔信息封裝為數(shù)據(jù)段;
S22:在傳輸層,將所述數(shù)據(jù)段封裝為數(shù)據(jù)包;
S23:在網(wǎng)絡(luò)互聯(lián)層,將數(shù)據(jù)包封裝為數(shù)據(jù)幀;
S24:在物理層,將數(shù)據(jù)幀封裝為比特流的形式。
本發(fā)明作進(jìn)一步改進(jìn),在步驟S4中,所述服務(wù)器選用centos操作系統(tǒng)。
本發(fā)明作進(jìn)一步改進(jìn),所述服務(wù)器采用hadoop作為服務(wù)器的的大數(shù)據(jù)分析平臺(tái),用Python作為數(shù)據(jù)分析算法。
本發(fā)明作進(jìn)一步改進(jìn),步驟S5中,所述服務(wù)器通過(guò)短息、郵箱或網(wǎng)頁(yè)的方式將結(jié)果發(fā)送給用戶,所述分析結(jié)果包括該篇文檔的情感傾向、主要內(nèi)容、是否存在敏感內(nèi)容、該文檔的字?jǐn)?shù)、段數(shù)、與其他類似文檔的相似度、文檔的出處。
本發(fā)明還提供了一種實(shí)現(xiàn)所述方法的系統(tǒng),包括用戶、客戶端和服務(wù)器,所述用戶用于通過(guò)客戶端上傳需要分析的文檔及分析條件,并獲取服務(wù)器返回的分析結(jié)果;所述客戶端用于通過(guò)四層模型將文檔信息封裝成比特流的形式,然后通過(guò)路由器上傳至服務(wù)器;所述服務(wù)器用于對(duì)數(shù)據(jù)解封裝,得到原始文檔信息,然后通過(guò)算法進(jìn)行數(shù)據(jù)分析,和大數(shù)據(jù)分析統(tǒng)計(jì),獲取文檔的相關(guān)信息,并將分析結(jié)果存儲(chǔ)至數(shù)據(jù)庫(kù),并將獲取的分析結(jié)果返回給用戶。
本發(fā)明作進(jìn)一步改進(jìn),所述服務(wù)器包括藍(lán)牙模塊和WIFI模塊,用于無(wú)線接收用戶的文檔信息。
本發(fā)明作進(jìn)一步改進(jìn),所述服務(wù)器與客戶端之間的通信協(xié)議包括網(wǎng)絡(luò)通信協(xié)議、用戶數(shù)據(jù)報(bào)協(xié)議和有線等效協(xié)議。
與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:數(shù)據(jù)傳輸更安全,提高人們工作效率;通過(guò)對(duì)文檔的內(nèi)容進(jìn)行分析,根據(jù)文檔里面出現(xiàn)的關(guān)鍵字、關(guān)鍵語(yǔ)句,來(lái)進(jìn)行內(nèi)容的分析,從而可以分析出該篇文檔的許多信息,用戶可以根據(jù)自己的需要,來(lái)設(shè)定自己想要看到的內(nèi)容,從而進(jìn)行檢索,避免時(shí)間浪費(fèi)在翻閱和整理上。
附圖說(shuō)明
圖1為本發(fā)明方法流程圖;
圖2為文檔處理流程圖;
圖3為一實(shí)施例方法流程圖;
圖4為用戶收到的分析結(jié)果。
具體實(shí)施方式
下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明做進(jìn)一步詳細(xì)說(shuō)明。
如圖1所示,本發(fā)明方法包括如下步驟:
S1:用戶通過(guò)客戶端上傳需要分析的文檔及分析條件;
S2:客戶端通過(guò)四層模型將文檔信息封裝成比特流的形式,然后通過(guò)路由器上傳至服務(wù)器;
S3:服務(wù)器解封裝,得到原始文檔信息;
S4:服務(wù)器通過(guò)算法進(jìn)行數(shù)據(jù)分析,和大數(shù)據(jù)分析統(tǒng)計(jì),獲取文檔的相關(guān)信息,并將分析結(jié)果存儲(chǔ)至數(shù)據(jù)庫(kù);
S5:服務(wù)器將獲取的分析結(jié)果返回給用戶。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市視維科技股份有限公司,未經(jīng)深圳市視維科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710555508.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:一種實(shí)時(shí)數(shù)據(jù)庫(kù)中基于規(guī)則集的快速壓縮方法
- 下一篇:一種挖掘規(guī)則關(guān)聯(lián)模型未知關(guān)聯(lián)關(guān)系的方法及裝置
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種電子文檔識(shí)別方法及裝置
- 文檔匹配方法和文檔匹配裝置
- 復(fù)雜文檔分離組織方法以及復(fù)雜文檔自動(dòng)生成方法
- 一種文檔流程控制方法及裝置
- 云文檔加密及解密方法、加密及解密裝置、以及處理系統(tǒng)
- 一種將Markdown文檔轉(zhuǎn)換為PDF文檔的方法、裝置
- 文檔類型識(shí)別方法、裝置、設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 基于文檔編輯軟件的文檔處理方法、裝置、設(shè)備及介質(zhì)
- 一種引用文檔的更新方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 文檔操作錄制方法、文檔操作動(dòng)畫(huà)生成方法、裝置及設(shè)備
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





