[發(fā)明專利]常數(shù)工作空間并行構造后綴數(shù)組的方法及系統(tǒng)在審

申請?zhí)枺?/td>	201810344030.2	申請日：	2018-04-17
公開（公告）號：	CN108763170A	公開（公告）日：	2018-11-06
發(fā)明（設計）人：	勞斌;解靜儀;徐文濤;農(nóng)革	申請（專利權）人：	佛山市順德區(qū)中山大學研究院;廣東順德中山大學卡內(nèi)基梅隆大學國際聯(lián)合研究院;中山大學
主分類號：	G06F17/22	分類號：	G06F17/22;G06F17/30
代理公司：	廣州嘉權專利商標事務所有限公司 44205	代理人：	左恒峰
地址：	528399 廣東省佛山市順德區(qū)***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	后綴數(shù)組工作空間字符串并行構造子串并行歸納計算機內(nèi)存時空復雜度唯一性輸入?yún)?shù) 首字符構建排序指針記錄
鉆瓜網(wǎng) 技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.常數(shù)工作空間并行構造后綴數(shù)組的方法，其特征在于，包括以下步驟：

S1、從右向左掃描一遍輸入的字符串X，按照后綴類型的定義比較當前掃描的兩個相鄰字符X[i]和X[i+1]，從而得到每一個字符和后綴的類型；

在掃描過程中，按照LMS子串的S⁺L⁺S類型模式定義找出所有LMS字符出現(xiàn)的位置，從而獲取字符串X中所有LMS子串的首字符指針，并記錄在數(shù)組P1中；

S2、通過數(shù)組P1和SA來對字符串X中所有的LMS子串進行常數(shù)工作空間內(nèi)的并行歸納排序，并將排序結果保存在SA1中；

其中,SA為用于記錄字符串X的后綴數(shù)組；SA1為用于記錄排序結果的后綴數(shù)組；

S3、根據(jù)排序結果在常數(shù)工作空間內(nèi)并行重命名字符串X中所有的LMS子串，從而形成字符串X1；

S4、檢查字符串X1中的每個字符是否唯一，若是則直接排序字符串X1的各后綴來計算字符串X1的后綴數(shù)組，保存至SA1中，否則以字符串X1和SA1作為新輸入?yún)?shù)替代字符串X和SA,分別遞歸調(diào)用至步驟S1和S2；

S5、根據(jù)獲得的保存在SA1中的字符串X1的后綴數(shù)組，在常數(shù)工作空間內(nèi)并行歸納計算字符串X的后綴數(shù)組，保存至SA中。

2.根據(jù)權利要求1所述的常數(shù)工作空間并行構造后綴數(shù)組的方法，其特征在于，所述步驟S1中從右向左掃描一遍字符串X，所采用的掃描方式包括分塊并行掃描、流水并行掃描以及前綴和并行掃描。

3.根據(jù)權利要求1所述的常數(shù)工作空間并行構造后綴數(shù)組的方法，其特征在于，所述步驟S2中，通過數(shù)組P1和SA來對字符串X中所有的LMS子串進行常數(shù)工作空間內(nèi)的并行歸納排序，包括以下步驟：

S21、初始化SA的所有元素為-1，并以前綴和并行方式掃描出字符串X中所有后綴在SA中所屬各桶的結束位置，記錄在大小為O(1)的桶數(shù)組B中；從右向左流水并行掃描字符串X，依次把掃描到的各LMS后綴填入其在SA中所屬桶的當前結束位置，并將該桶的結束位置向左移動一格；

S22、以前綴和并行方式掃描出字符串X中所有后綴在SA中所屬各桶的起始位置，記錄在大小為O(1)的桶數(shù)組B中，并對SA進行分塊并行掃描處理：

在當前塊內(nèi)從左向右掃描SA，針對掃描到的每個不為-1的元素SA[i]，從SA中讀取X[SA[i]]的前繼字符X[SA[i]-1]；若該前繼字符是L型，則將SA[i]-1的值以及suf(X,SA[i]-1)的后綴在SA中所屬桶的當前起始位置作為排序結果記錄在SA中，并將該桶的起始位置向右移動一格；

讀取前一塊的排序結果并記錄在SA中；

讀取后一塊的所有前繼字符并記錄在SA中；

S23、以前綴和并行方式掃描出字符串X中所有后綴在SA中所屬各桶的結束位置，記錄在大小為O(1)的桶數(shù)組B中，并對SA進行分塊并行掃描處理：

在當前塊內(nèi)從右向左掃描SA，針對掃描到的每個元素SA[i]，從SA中讀取X[SA[i]]的前繼字符X[SA[i]-1]；若該前繼字符是S型，則將SA[i]-1的值以及suf(X,SA[i]-1)的后綴在SA中所屬桶的當前結束位置作為排序結果記錄在SA中，并將該桶的結束位置向左移動一格；

讀取前一塊的排序結果并記錄在SA中；

讀取后一塊的所有前繼字符并記錄在SA中。

4.根據(jù)權利要求1所述的常數(shù)工作空間并行構造后綴數(shù)組的方法，其特征在于，所述步驟S3，根據(jù)排序結果在常數(shù)工作空間內(nèi)并行重命名字符串X中所有的LMS子串，從而形成字符串X1，包括以下步驟：S31、將SA1中已排序的LMS子串進行分塊，在每個分塊內(nèi)從左向右依次比較相鄰的兩個LMS子串的大小；對于每個LMS子串，用其在SA1中所屬桶的起始位置命名，第一個桶的起始位置從0開始，即得到各分塊內(nèi)LMS子串的局部名；

S32、利用前綴和方法統(tǒng)計每個分塊中可使用的全局名，將各分塊內(nèi)LMS子串的局部名替換為全局名，從而形成字符串Z1；

S33、從右到左對字符串Z1進行分塊并行掃描，針對每個被掃描到的字符Z1[i]，若Z1[i]為L型，則令X1[i]＝Z1[i]，否則將X1[i]設為Z1[i]在SA1中所屬桶的結束位置；待掃描Z1結束后，X1即為對Z1中各S型字符重命名后的結果。

下載完整專利技術內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于佛山市順德區(qū)中山大學研究院;廣東順德中山大學卡內(nèi)基梅隆大學國際聯(lián)合研究院;中山大學，未經(jīng)佛山市順德區(qū)中山大學研究院;廣東順德中山大學卡內(nèi)基梅隆大學國際聯(lián)合研究院;中山大學許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201810344030.2/1.html，轉載請聲明來源鉆瓜專利網(wǎng)。

上一篇：一種路網(wǎng)空間的相遇概率計算方法
下一篇：一種基于格式模板的文檔自動化生成方法

同類專利

專利分類

G 物理

G06 計算；推算；計數(shù)
G06F 電數(shù)字數(shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計算設備或數(shù)據(jù)處理設備或數(shù)據(jù)處理方法
G06F17-10 .復雜數(shù)學運算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索；及其數(shù)據(jù)庫結構
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計算機輔助設計

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】