日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種串數據詞典的有序構造及檢索方法有效

專利信息
申請號: 201410006131.0 申請日: 2014-01-06
公開(公告)號: CN103761270B 公開(公告)日: 2017-02-01
發明(設計)人: 馬云龍;林鴻飛 申請(專利權)人: 大連理工大學
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 大連星海專利事務所21208 代理人: 徐雪蓮
地址: 116023 遼*** 國省代碼: 遼寧;21
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 數據 詞典 有序 構造 檢索 方法
【說明書】:

技術領域

發明涉及信息檢索、自然語言處理和模式識別與匹配領域,尤其是一種適用于任意規模串數據的詞典的有序構造及檢索方法。

背景技術

針對串數據的詞典構造與檢索一直是信息檢索、自然語言處理和模式識別與匹配等領域很多應用中的重要技術環節,詞典的構造與檢索速度很大程度上決定了應用系統的整體性能。例如:搜索引擎中倒排索引項的定位、文本處理中的分詞及同義詞替換、文本編輯器中的拼寫檢查、輸入法中的文本聯想等環節對相應詞典的構造和檢索性能要求都非常高。

由于詞典的構造和檢索在實際應用中的關鍵性地位,受到大量業內人士的關注,因此對于該問題的研究成果也較豐富。現今常用的串數據詞典的結構和表示方式包括線性表、二叉樹、檢索樹和散列表。

線性表是一種將數據的鍵在邏輯上依次存儲的數據結構。當對數據進行無序約束存儲時,每次檢索的最差時間復雜度為O(n)(其中n為已知的不重復數據項數量,下文同),效率很低,無法滿足高速檢索要求;當數據以有序約束存儲時,配合二分查找算法,每次檢索的最差時間復雜度降低為O(log2n),在可接受范圍內,但每次對詞典條目增加或刪除操作的最差時間復雜度上升為O(n),效率低下。

二叉樹是一種將表示數據鍵的節點按層次邏輯存儲的數據結構。其一般約束為任意節點至多有左或右子節點各一個,其鍵大于其左子節點且小于其右子節點。使用該數據結構的詞典在增加、刪除和檢索條目過程中的時間消耗通常與樹的最大高度成正比,因此對樹高的控制尤為重要。現今較為成熟的樹高控制策略包括B樹、B+樹、紅黑樹等,使用得當的情況下可將每次操作的最差時間復雜度近似等于O(log2n)。雖然相對線性表其速度有一定程度的提升,但仍然無法滿足大規模數據環境下的速度要求,另外當以串數據為鍵時由于需將所有相應串數據完整保存在每個節點中因此造成很大的存儲空間浪費,同時最差時間復雜度增加到O(l×log2n)(其中l為串數據長度,下文同)。

對于詞典應用而言,檢索為其最重要的功能,尤其在自然語言處理類應用中,需要頻繁的在詞典中進行檢索以獲取條目信息,因此串數據的檢索效率對于詞典方法來說是一個非常重要的評價指標。

檢索樹是一種以對串數據鍵進行優化為目標的數據結構,其中以串數據中每一數據單元為一節點,將各節點按層次邏輯存儲。其經典實現為指針結構的TRIE樹,在合適的環境下使用可以具有很高的效率,其增加、刪除和檢索條目的時間消耗通常只與l成正比。相對線性表與二叉樹結構,速度有大幅提高,最差時間復雜度可以近似等于O(l)。但是由于很多情況下TRIE樹中大多數節點的分支節點很少,因此其空間浪費非常多,在千萬數量級的應用中,幾乎無法在計算機內存中進行高速操作;另外,當分支節點非常多時,在分支節點間進行二分查找又會增加更多的時間開銷。先前有研究者提出將TRIE樹轉換為雙數組結構,令其空間浪費大幅減少,并優化了分支節點檢索過程,使其查詢速度完全等于O(l),能夠滿足大部分應用環境下的高速檢索需求。然而,在查詢串模糊匹配或聯想輸入等應用環境下需要對字典有序遍歷,而雙數組結構TRIE樹無法實現高效的有序遍歷,最差時間復雜度為O(n2×l),幾乎無法在真實環境下使用。

基于散列表的詞典機制就是構造一種哈希函數來計算詞語的散列值,采用合理的哈希函數可盡量控制散列值分布的均勻性從而避免沖突,當遇到沖突時將散列值相同的詞放入一個線性表結構存儲。檢索時先使用哈希函數計算查詢串的散列值,進而取值,當遇到沖突時則在相應的線性表內進行二分查找,因此當第一次散列值計算不成功時,散列表的查詢性能會大幅下降,所以散列表詞典的性能關鍵即為哈希函數的設計。在完美哈希函數設計的研究成果中,生成完美哈希函數所用的時間開銷通常很高,即便在Linux系統下最著名的完美哈希函數生成器Gperf,也無法保證在大規模數據下仍然能生成完美哈希函數,當詞典條目超過15000個時其散列性能很差,尤其對類似中文的多字節大字符集語言的處理效果更差。另一方面,由于哈希函數的設計目標為均勻分布,因此通常無法保證詞典條目的有序性,進行有序遍歷時需對所有詞典條目先行排序,從效率方面來看幾乎無法實際應用。

發明內容

本發明的目的是提供一種構造及檢索效率高、能滿足不同應用環境下對詞典有序性和靈活性的要求,且同時仍保持較少空間占用的串數據的有序構造及檢索方法。

本發明解決現有技術問題所采用的技術方案:一種串數據詞典的有序構造及檢索方法,包括以下步驟:

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連理工大學,未經大連理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201410006131.0/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产精品对白刺激在线观看| 一区二区三区电影在线观看| 亚洲精品日韩精品| 九九精品久久| 中文字幕在线乱码不卡二区区| 免费看片一区二区三区| 国产一区二区精品免费| 99久精品视频| 日韩精品一区二区三区在线| 国产精品一二三在线观看| 国产一区二三| 99爱国产精品| 国产全肉乱妇杂乱视频在线观看| 精品国产一区二区三区免费| 91夜夜夜| 少妇在线看www| 欧美一区二区三区在线视频播放| 国产91麻豆视频| 久久久综合亚洲91久久98| ass韩国白嫩pics| 精品国产乱码久久久久久图片| 国产精品久久久麻豆| 国产伦精品一区二区三区无广告| 久久精品手机视频| 国产真裸无庶纶乱视频 | 国产亚洲精品久久777777| 亚洲在线久久| 日韩欧美视频一区二区| 亚洲欧美日韩综合在线 | 亚洲欧洲一区| 日韩中文字幕在线一区二区| 亚洲三区二区一区| 亚洲午夜精品一区二区三区| 国产在线欧美在线| 色综合久久久久久久粉嫩| 91久久精品国产91久久性色tv| 中文乱幕日产无线码1区| 福利片91| 日韩av一区不卡| 国产精品亚洲一区二区三区| 国产精品一级片在线观看| 欧美3p激情一区二区三区猛视频| 91av一区二区三区| 国产一区二区三区四区五区七| 国产精品爽到爆呻吟高潮不挺| 正在播放国产一区二区| 国产精选一区二区| 久久久久亚洲| 午夜影院一区| 国产黄色网址大全| 日韩精品久久久久久中文字幕8| 欧美日韩三区二区| 夜夜夜夜夜猛噜噜噜噜噜gg| 一区二区国产精品| 日本看片一区二区三区高清| 国产剧情在线观看一区二区| 久久精品手机视频| 久久精品国产一区二区三区不卡| 日日噜噜夜夜狠狠| 欧美激情综合在线| 国产日产精品一区二区三区| 国产一二区在线| 国产精品suv一区二区6| 国产欧美三区| 99er热精品视频国产| 日韩精品一区二区三区不卡| 日韩午夜三级| 久久精品综合视频| 久久99中文字幕| 久久午夜鲁丝片午夜精品| 日韩精品中文字| 国产精品女人精品久久久天天 | 午夜在线看片| 国产91电影在线观看| 午夜毛片在线看| 国产日韩精品一区二区| 狠狠色噜噜狠狠狠狠黑人| 久久国产免费视频| 精品香蕉一区二区三区| av午夜剧场| 国产一区网址| 久久综合狠狠狠色97| 久久精品一二三四| 欧美视频1区| 国产精品久久久久激情影院| 日本精品99| 在线国产一区二区三区| 国产一区二区麻豆| 夜夜躁日日躁狠狠躁| 欧美精品五区| 国产精品久久久不卡| 久久久综合香蕉尹人综合网| 国产精品麻豆99久久久久久| 久久久久国产精品www| 国产三级欧美三级日产三级99| 国产一区二区伦理| aaaaa国产欧美一区二区| 99久久婷婷国产综合精品电影 | 国产精品69久久久| 亚洲欧美日韩精品suv| 亚洲福利视频二区| 日韩国产精品一区二区| 欧美激情综合在线| 手机看片国产一区| 69久久夜色精品国产69–| 国产有码aaaae毛片视频| 91夜夜夜| 久久影院国产精品| 国产精品入口麻豆九色| 夜夜爱av| 欧美日韩国产色综合视频| 久久不卡精品| 自拍偷在线精品自拍偷无码专区 | 国产午夜精品一区理论片飘花| 日本不卡精品| 国产二区视频在线播放| 欧美激情精品一区| 欧美网站一区二区三区| 久久精品综合视频| 精品国产一二三四区| 狠狠躁天天躁又黄又爽| 中文文精品字幕一区二区| 国产在线卡一卡二| 91社区国产高清| 亚洲国产精品日韩av不卡在线| 欧美日韩三区二区| 亚洲国产精品精品| 午夜老司机电影| 国产一区免费播放| 国内少妇自拍视频一区| 欧美三级午夜理伦三级中视频| 狠狠色噜噜狠狠狠狠2021免费 | 99久精品视频| 国产欧美一区二区在线观看| 国产精品高潮呻| 一区二区三区日韩精品| 国产在线视频99| 波多野结衣女教师电影| 精品国产鲁一鲁一区二区作者| 久久99视频免费| 国产欧美日韩中文字幕| 在线亚洲精品| 国产69精品久久久久9999不卡免费| 欧美日韩中文国产一区发布| 夜夜精品视频一区二区| 久久久久久亚洲精品| 国产一区二区三区四| 91久久香蕉| 国产真实一区二区三区| 日韩av在线网| 欧美高清xxxxx| 欧美精品免费视频| 中文字幕日韩有码| 人人澡超碰碰97碰碰碰| 国产欧美日韩一级| 日韩午夜三级| 欧美一区二区久久| 国产精品久久久久久久妇女| 亚洲少妇一区二区| 久99久精品| 国产精品日韩电影| 欧美午夜一区二区三区精美视频| 日日狠狠久久8888偷色| 国产一区在线视频观看| 在线观看v国产乱人精品一区二区 国产日韩欧美精品一区二区 | 中文字幕一区2区3区| 又黄又爽又刺激久久久久亚洲精品| 精品福利一区二区| 九一国产精品| 欧美在线观看视频一区二区三区 | 色婷婷精品久久二区二区我来| 欧美精品日韩一区| 国产精品久久久久久久久久不蜜月| 国产精品亚州| 久久99精品国产麻豆婷婷洗澡| 午夜亚洲影院| 国产黄色一区二区三区| 国产精品视频免费看人鲁| 国产第一区在线观看| 久久99精品久久久秒播| 欧美69精品久久久久久不卡| 国产精品视频二区三区| 国产欧美亚洲精品| 夜夜嗨av色一区二区不卡| 九九久久国产精品| 欧美xxxxhdvideos| 在线观看v国产乱人精品一区二区| 97涩国一产精品久久久久久久| 在线视频国产一区二区| 久久96国产精品久久99软件| 国产日韩欧美综合在线| 日韩女女同一区二区三区| 黄色国产一区二区| 91精品福利观看| 美女被羞羞网站视频软件| 国产91久| 91免费国产视频| 日韩夜精品精品免费观看| 97精品国产aⅴ7777| xxxxhd欧美| 国产一区二区黄| 精品国产一区二区三区久久久久久| 91久久香蕉国产日韩欧美9色| 国产精品一区二区免费视频| 日韩av在线资源| 国产精品96久久久| 亚洲精品456| 国产乱一乱二乱三| 精品无码久久久久国产| 久久久久国产精品嫩草影院| 国产一区二区三区久久久| 国产清纯白嫩初高生在线播放性色 | 久久久久国产亚洲| 国产精欧美一区二区三区久久久| 国产午夜精品一区| 日本精品一区二区三区视频| xxxxhd欧美| 国产精品久久国产精品99 | 91精品国产高清一区二区三区| 一区二区在线国产| 国产乱色国产精品播放视频| 国产午夜精品一区| 国语对白老女人一级hd| 国产精品欧美日韩在线| 国产美女视频一区二区三区| 狠狠插狠狠插| 欧美精品乱码视频一二专区| 国产精品18久久久久久白浆动漫| 国产日韩欧美精品一区二区| 国产乱码精品一区二区三区介绍| 欧美一区二区三区艳史| 久久精品一二三| 欧美国产一区二区在线| 午夜wwww| 狠狠色噜噜狠狠狠狠奇米777| 国产精品亚洲二区| 中文字幕一区二区三区不卡| 国产一级在线免费观看| 精品福利一区| 国产高清精品一区二区| 波多野结衣女教师30分钟| 色噜噜狠狠色综合中文字幕| 不卡在线一区二区| 中文字幕欧美日韩一区 | 狠狠色综合久久婷婷色天使| 97久久国产亚洲精品超碰热|