日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種從文檔集中快速提取有用數據的方法有效

專利信息
申請號: 201710985840.1 申請日: 2017-10-20
公開(公告)號: CN107861943B 公開(公告)日: 2020-03-24
發明(設計)人: 劉軍旗;蘇愛軍;唐輝明;吳沖龍;姚夢輝;滕偉福;王亮清;封瑞雪;趙劍雄;陳根深;鄒宗興;王菁莪;曾雯;張抒 申請(專利權)人: 中國地質大學(武漢)
主分類號: G06F40/289 分類號: G06F40/289;G06F16/903
代理公司: 武漢知產時代知識產權代理有限公司 42238 代理人: 付春霞
地址: 430074 湖*** 國省代碼: 湖北;42
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 文檔 集中 快速 提取 有用 數據 方法
【說明書】:

發明提供一種從文檔集中快速提取有用數據的方法,包括以下步驟:1:進行分詞處理,得到每個文檔中的潛在檢索詞和該文檔中的每個段落中的潛在檢索詞;2:進行詞頻統計,得到每個段落中每個潛在檢索詞的詞頻統計結果,和文檔整體的潛在檢索詞的詞頻統計結果;3:采用非結構化數據庫技術進行存儲,使所述文檔集中所有文檔轉化為非結構化數據庫中的一個有序集合;4:輸入檢索詞,在具有有序集合的非結構化數據庫中實施檢索;5:輸出檢索結果。有益效果:檢索簡單、使用方便。

技術領域

本發明涉及信息檢索技術領域,尤其涉及一種從文檔集中快速提取有用數據的方法。

背景技術

非結構化數據庫:一般來說,非結構化數據是數據結構不規則或不完整,沒有預定義的數據模型,不方便采用類似關系型數據庫以二維表來表達的數據。如Word、PDF等文檔類數據,圖片類數據,圖像、音頻、視頻類數據等。非結構化數據在所有數據中占有很大的比重。采用關系型數據庫等傳統結構化數據庫對非結構數據進行管理,很難方便地挖掘蘊含在非結構化數據中的有價值信息。

中文分詞技術:中文分詞是指將文本中連續的字序列按照一定的規范切分成一個個單獨的詞,并重新組合成詞序列的過程。

詞頻統計技術:某個詞在某個文件中出現的次數稱為該詞在該文件中的詞頻。目前詞頻統計一般采用TF-IDF(term frequency–inverse document frequency)方法。這是一種用于情報檢索與文本挖掘的常用加權技術,用以評估一個詞對于一個文件或者一個語料庫中的一個領域文件集的重要程度。字詞的重要性隨著它在文件中出現的次數成正比增加,但同時會隨著它在語料庫中出現的頻率成反比下降。

文檔檢索是指在輸入檢索詞的情況下,在文檔數據庫中查找具有所述檢索詞的最優文檔的過程。隨著社會生活、工作的節奏的不斷加快和文檔數量、詞語數量的不斷增加,在海量數據中只進行文檔查找,即使查找到了相關文檔,還需要花費大量時間在這些相關文檔中人工查找相關數據,效率極低且相當困難。例如:地質災害工作積累了大量的文檔資料,這些文檔資料一般都是以整篇文檔為單位進行整體存儲,要從一個或多個文檔中提取某個具體數據或信息,或要確定某個具體數據或信息在某個或某幾個文檔的哪個具體段落中,并把這些信息快速提取出來,到目前為止都是很困難的。

發明內容

有鑒于此,本發明的實施例提供了一種檢索簡單、使用方便的從文檔集中快速提取有用數據的方法。

本發明的實施例提供一種從文檔集中快速提取有用數據的方法,包括以下步驟:

步驟1:使用中文分詞工具,對文檔集中的每個文檔進行包括分詞、詞性標注及分詞篩選在內的預處理,得到每個文檔中的潛在檢索詞和該文檔中的每個段落中的潛在檢索詞;

步驟2:對所述文檔集中的每個文檔中的每個段落中的潛在檢索詞進行詞頻統計,得到每個段落中每個潛在檢索詞的詞頻統計結果,基于段落的詞頻統計結果得到相應的文檔整體的潛在檢索詞的詞頻統計結果;

步驟3:采用非結構化數據庫技術存儲經步驟1和步驟2處理后的文檔集,對所述文檔集中的每個文檔建立一個存儲集,每個存儲集的存儲內容包括:{文檔的名稱、文檔的內容、文檔中每個段落的潛在檢索詞及每個所述潛在檢索詞的詞頻統計結果、文檔的潛在檢索詞及每個所述潛在檢索詞的詞頻統計結果、存儲時間},使所述文檔集中所有文檔轉化為非結構化數據庫中的一個有序集合;

步驟4:輸入檢索詞,在具有有序集合的非結構化數據庫中實施檢索;

步驟5:根據檢索詞與潛在檢索詞的匹配,以及潛在檢索詞的詞頻統計結果,輸出檢索結果。

進一步地,所述潛在檢索詞包括名詞、動詞和數量詞。

進一步地,步驟1中所述的分詞篩選為剔除經分詞和詞性標注后的詞中的非潛在檢索詞,所述非潛在檢索詞包括連詞、副詞和語氣詞。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國地質大學(武漢),未經中國地質大學(武漢)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201710985840.1/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 欧美高清性xxxxhdvideos | 亚洲国产精品91| 91香蕉一区二区三区在线观看| 欧美午夜看片在线观看字幕| 国产一区二区在线观看免费| 国产大片黄在线观看私人影院| 日韩美一区二区三区| 中文字幕在线一二三区| 天摸夜夜添久久精品亚洲人成| 国产精品女同一区二区免费站| 国产一卡在线| 国产精品乱码久久久久久久久| 国偷自产一区二区三区在线观看| 日韩精品福利片午夜免费观看| 欧美国产亚洲精品| 国产欧美一区二区精品久久| 国产91清纯白嫩初高中在线观看 | 欧美一区二区三区日本| 欧美片一区二区| 日韩无遮挡免费视频| 精品国产精品亚洲一本大道| 国产在线一区不卡| 91久久香蕉| 色一情一乱一乱一区99av白浆| 日韩午夜毛片| 精品久久9999| 午夜精品一二三区| 国产女人和拘做受视频免费| 国产一区二区三区影院| 韩漫无遮韩漫免费网址肉| 国产精品69av| 国产理论一区| 99国产精品| 午夜国产一区二区| 国产精品一区二区在线看| 日本美女视频一区二区三区| 岛国黄色av| 国产午夜精品一区理论片飘花| 国产免费第一区| 精品国产一区二区三区国产馆杂枝| 午夜理伦影院| 99精品国产免费久久| 日韩av三区| 年轻bbwbbw高潮| 精品国产乱码久久久久久a丨| 97精品国产97久久久久久免费| 国产区精品| 欧美资源一区| 欧美在线免费观看一区| 日韩午夜一区| 精品久久综合1区2区3区激情| 午夜wwwww| 4399午夜理伦免费播放大全| 亚洲欧美日韩另类精品一区二区三区| 夜夜躁人人爽天天天天大学生| 欧美日本一二三区| 久久伊人色综合| 99久久国产免费| 国产69精品久久久久999小说| 国产伦精品一区二区三区免费下载| 国产一区影院| 日本一区二区在线观看视频| 久久99精品国产麻豆婷婷洗澡| 国产精品一二三区视频网站| 亚洲精品20p| 国产精品乱码一区| 欧美色图视频一区| 国产日韩精品一区二区三区| 色一情一乱一乱一区免费网站| 午夜社区在线观看| 免费精品99久久国产综合精品应用| 国产一区观看| 国产欧美日韩va另类在线播放| 国产精品日韩视频| 国产经典一区二区| 欧美日韩三区二区| 99国产精品永久免费视频 | 91久久国产露脸精品国产| 日韩av中文字幕一区二区| 国产精品视频久久久久| 日韩av在线播| 妖精视频一区二区三区| 日韩av片无码一区二区不卡电影| 欧美日韩一区在线视频| 久久国产精品久久| 欧美高清xxxxx| 97香蕉久久国产超碰青草软件| 久久二区视频| 91精品高清| 99久国产| 欧美精品一区二区久久久| 精品国产一区二区三区高潮视| 99精品一区| 精品国产一区在线| 肥大bbwbbwbbw高潮| 欧美一区二区精品久久911| 亚洲视频h| 视频国产一区二区| 九九热国产精品视频| 国产精品高潮呻吟三区四区 | 国产精品视频免费一区二区| 天天射欧美| 高清国产一区二区三区| 欧美一区二三区人人喊爽| 国产91色综合| 国产原创一区二区| 国产欧美视频一区二区三区| 欧美国产三区| 国产精品1234区| 国产精品不卡在线| 国内精品国产三级国产99| 夜夜爽av福利精品导航| 国产精品亚洲а∨天堂123bt| 国产一区二区电影在线观看| 精品国产乱码久久久久久老虎| 中文乱码字幕永久永久电影| 国产精品乱战久久久| 国产日产精品一区二区三区| 久久99精品国产麻豆宅宅| 91久久香蕉国产日韩欧美9色| 精品一区欧美| 国产高清精品一区| 亚洲福利视频二区| 国产精品久久久久久久新郎| 国产91九色视频| 欧美日韩一卡二卡| 久久久精品欧美一区二区| 国产精品丝袜综合区另类| 国产精品乱码一区| 99久久免费精品国产免费高清| 国产精品一区二区三| 国产精品一区二区麻豆| 亚洲精品国产久| 91秒拍国产福利一区| 蜜臀久久精品久久久用户群体| 99国产精品永久免费视频| 国产盗摄91精品一区二区三区| 国产精品网站一区| 国产一区影院| 国产欧美亚洲一区二区| 狠狠色噜噜狠狠狠四色米奇| 国产jizz18女人高潮| 99久久国产免费,99久久国产免费大片| 国产日韩精品久久| 国产一级自拍片| 九色国产精品入口| 国产日韩欧美在线一区| 国产农村妇女精品一区二区| 国产91一区| 91精品资源| 性生交大片免费看潘金莲| 在线视频国产一区二区| 日本xxxxxxxxx68护士| 99久久精品一区字幕狠狠婷婷 | 欧美乱妇在线观看| 欧美极品少妇| 99国产精品一区| 日本xxxx护士高潮hd| 欧美日韩精品在线播放| 97人人模人人爽视频一区二区 | 久久aⅴ国产欧美74aaa| 亚洲欧美一卡二卡| 性色av色香蕉一区二区| 亚洲精品456| 自拍偷在线精品自拍偷无码专区| 国产色99| av不卡一区二区三区| 欧美日韩精品中文字幕| 国产一区免费在线观看| 午夜影院一区二区| 亚洲二区在线播放视频| 91麻豆精品国产91久久久更新资源速度超快 | 性old老妇做受| 欧美一区二区三区精品免费| 久久99久久99精品蜜柚传媒| 精品久久久久久中文字幕| 人人玩人人添人人澡97| 国产欧美www| 欧美一区二区三区在线免费观看| 亚洲欧洲一二三区| 国产精品天堂| 一区二区国产盗摄色噜噜| 欧美精品日韩| 亚洲国产精品区| 国产999久久久| 97久久超碰国产精品红杏| 色噜噜狠狠色综合久| 国产精品电影一区二区三区| 97精品国产97久久久久久| 国产二区三区视频| 国产.高清,露脸,对白| 麻豆9在线观看免费高清1| 欧美精品国产一区二区| 国产伦精品一区二区三区照片91 | 色噜噜狠狠色综合影视| 亚洲国产午夜片| 日韩精品久久久久久久酒店| 国产va亚洲va在线va| 亚洲精品国产精品国产| 国产精品综合一区二区| 91麻豆精品国产自产欧美一级在线观看| 日本一区二区三区免费在线| 国产视频精品一区二区三区| 中文字幕日韩有码| 综合久久激情| 国产亚洲精品久久网站| 91麻豆精品国产91久久久久推荐资源 | 国产午夜亚洲精品午夜鲁丝片| 国产无遮挡又黄又爽又色视频| 中文字幕一二三四五区| 午夜精品影视| 欧美髙清性xxxxhdvid| 日本五十熟hd丰满| 亚洲日韩欧美综合| 国产精品一区二区免费| 51区亚洲精品一区二区三区| 99精品国产一区二区三区不卡| 中文字幕一二三四五区| 手机看片国产一区| 国内精品久久久久久久星辰影视 | 国产精品自拍不卡| 日韩久久精品一区二区| 国产一区在线视频观看| 国产精品高潮呻吟视频| 波多野结衣女教师30分钟| 国产一二三区免费| 欧美一区二区免费视频| 国产精品99久久久久久宅男| 国产精品三级久久久久久电影| 国产乱码一区二区三区| 国产精品女人精品久久久天天| 久久精视频| 国产精品久久久视频| 91精品www| 亚洲乱码av一区二区三区中文在线:| 国产精品免费自拍| 欧美日韩一区电影| 午夜电影一区二区三区| 久久精品—区二区三区| 国产欧美亚洲精品| 日本高清不卡二区| 午夜爽爽爽男女免费观看| 欧美日韩三区二区| 99久久国产综合| 色一情一交一乱一区二区三区| 一区二区三区中文字幕|