[發(fā)明專利]基于散列的串匹配方法及其選擇模式串子窗口的方法無效
| 申請(qǐng)?zhí)枺?/td> | 201110162453.0 | 申請(qǐng)日: | 2011-06-16 |
| 公開(公告)號(hào): | CN102243656A | 公開(公告)日: | 2011-11-16 |
| 發(fā)明(設(shè)計(jì))人: | 邵妍;劉燕兵;王勇;劉慶云;郭莉;譚建龍;陳訓(xùn)遜;汪立東 | 申請(qǐng)(專利權(quán))人: | 中國科學(xué)院計(jì)算技術(shù)研究所;國家計(jì)算機(jī)網(wǎng)絡(luò)與信息安全管理中心 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 北京泛華偉業(yè)知識(shí)產(chǎn)權(quán)代理有限公司 11280 | 代理人: | 王勇 |
| 地址: | 100190 北*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 匹配 方法 及其 選擇 模式 窗口 | ||
1.一種用于基于散列的串匹配中的選擇模式串子窗口的方法,所述方法包括:
步驟1)求得模式串集合中最短模式串長(zhǎng)度m;
步驟2)對(duì)于模式串集合中的每個(gè)模式串,計(jì)算其所有長(zhǎng)度為m的子串的散列值,組成散列值集合;
步驟3)確定所述模式串集合與所述散列值集合中的元素的一一對(duì)應(yīng)關(guān)系,所述對(duì)應(yīng)關(guān)系應(yīng)滿足模式串所對(duì)應(yīng)的散列值是根據(jù)該模式串的一個(gè)長(zhǎng)度為m的子串計(jì)算出散列值,同時(shí)將這個(gè)子串設(shè)置為該模式串的子窗口。
2.根據(jù)權(quán)利要求1所述的選擇模式串子窗口的方法,所述步驟3)包括以下步驟:
統(tǒng)計(jì)各模式串長(zhǎng)度為m的子串的散列值的出現(xiàn)次數(shù);
對(duì)于每個(gè)模式串,選擇出現(xiàn)次數(shù)最少的其子串的散列值與該模式串相對(duì)應(yīng)并將該子串設(shè)置為該模式串的子窗口。
3.根據(jù)權(quán)利要求1所述的選擇模式串子窗口的方法,所述步驟3)包括以下步驟:
用數(shù)組Count[hi]來記錄模式串集合中各模式串長(zhǎng)度為m的子串的散列值hi的出現(xiàn)次數(shù);
對(duì)于每個(gè)模式串,逐個(gè)掃描其長(zhǎng)度為m的子串pi,子串pi的散列值表示為hi,選取Count[hi]最小的子串pi來作為該模式串的子窗口。
4.根據(jù)權(quán)利要求1所述的選擇模式串子窗口的方法,所述步驟3)中采用最大流法來確定所述模式串集合與所述散列值集合中的元素的一一對(duì)應(yīng)關(guān)系。
5.根據(jù)權(quán)利要求1所述的選擇模式串子窗口的方法,所述步驟3)中采用匈牙利法來確定所述模式串集合與所述散列值集合中的元素的一一對(duì)應(yīng)關(guān)系。
6.一種基于散列的串匹配方法,所述方法包括以下步驟:
步驟1)求得模式串集合中最短模式串長(zhǎng)度m;
步驟2)對(duì)于模式串集合中的每個(gè)模式串,計(jì)算其所有長(zhǎng)度為m的子串的散列值,組成散列值集合;
步驟3)確定所述模式串集合與所述散列值集合中的元素的一一對(duì)應(yīng)關(guān)系,所述對(duì)應(yīng)關(guān)系應(yīng)滿足模式串所對(duì)應(yīng)的散列值是根據(jù)該模式串的一個(gè)長(zhǎng)度為m的子串計(jì)算出散列值,同時(shí)將這個(gè)子串設(shè)置為該模式串的子窗口;
步驟4)對(duì)模式串集合中每個(gè)模式串,截取該模式串的子窗口來計(jì)算該模式串的散列值,并建立散列表。
7.根據(jù)權(quán)利要求6所述的串匹配方法,所述步驟3)包括以下步驟:
統(tǒng)計(jì)各模式串長(zhǎng)度為m的子串的散列值的出現(xiàn)次數(shù);
對(duì)于每個(gè)模式串,選擇出現(xiàn)次數(shù)最少的其子串的散列值與該模式串相對(duì)應(yīng)并將該子串設(shè)置為該模式串的子窗口。
8.根據(jù)權(quán)利要求6所述的串匹配方法,所述步驟3)包括以下步驟:
用數(shù)組Count[hi]來記錄模式串集合中各模式串長(zhǎng)度為m的子串的散列值hi的出現(xiàn)次數(shù);
對(duì)于每個(gè)模式串,逐個(gè)掃描其長(zhǎng)度為m的子串pi,子串pi的散列值表示為hi,選取Count[hi]最小的子串pi來作為該模式串的子窗口。
9.根據(jù)權(quán)利要求6所述的串匹配方法,所述步驟3)中采用最大流法來確定所述模式串集合與所述散列值集合中的元素的一一對(duì)應(yīng)關(guān)系。
10.根據(jù)權(quán)利要求6所述的串匹配方法,所述步驟3)中采用匈牙利法來確定所述模式串集合與所述散列值集合中的元素的一一對(duì)應(yīng)關(guān)系。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院計(jì)算技術(shù)研究所;國家計(jì)算機(jī)網(wǎng)絡(luò)與信息安全管理中心,未經(jīng)中國科學(xué)院計(jì)算技術(shù)研究所;國家計(jì)算機(jī)網(wǎng)絡(luò)與信息安全管理中心許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110162453.0/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





