[發明專利]一種DNA序列數據壓縮系統有效
| 申請號: | 201110002601.2 | 申請日: | 2011-01-07 |
| 公開(公告)號: | CN102081707A | 公開(公告)日: | 2011-06-01 |
| 發明(設計)人: | 紀震;周家銳;朱澤軒;儲穎 | 申請(專利權)人: | 深圳大學 |
| 主分類號: | G06F19/10 | 分類號: | G06F19/10 |
| 代理公司: | 深圳市君勝知識產權代理事務所 44268 | 代理人: | 王永文;楊宏 |
| 地址: | 518060 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 dna 序列 數據壓縮 系統 | ||
1.一種DNA序列數據壓縮系統,其特征在于,所述DNA序列數據壓縮系統包括:
MA-ARV碼本設計模塊,用于構造針對當前輸入DNA序列數據的壓縮碼本;
DNA序列數據壓縮模塊,用于根據MA-ARV碼本對輸入數據進行無損壓縮編碼;
DNA序列數據解壓模塊,用于對壓縮后的數據文件進行解壓恢復操作。
2.根據權利要求1所述的DNA序列數據壓縮系統,其特征在于,所述DNA序列數據壓縮系統還包括輸入模塊、檢測模塊和輸出模塊;
所述輸入模塊、檢測模塊、DNA序列數據壓縮模塊與輸出模塊依次相連,所述檢測模塊還分別與MA-ARV碼本設計模塊、DNA序列數據解壓模塊相連,所述MA-ARV碼本設計模塊與DNA序列數據壓縮模塊相連。
3.根據權利要求1所述的DNA序列數據壓縮系統,其特征在于,所述MA-ARV碼本設計模塊將當前輸入DNA序列數據表示為MA-ARV矢量v,其直接重復模式冗余片段表示為相同矢量v,鏡像重復片段為矢量v-1;根據堿基配對原則,對于配對重復片段有矢量v*,對于反轉重復片段有矢量v-1*。
4.根據權利要求1所述的DNA序列數據壓縮系統,其特征在于,所述DNA序列數據壓縮系統在壓縮數據時,使用編碼格式為?{id,?repeat?type,?{edit?error}},其中id為對應MA-ARV碼矢量編號,repeat?type為重復模式,edit?error為編輯誤差信息序列。
5.根據權利要求4所述的DNA序列數據壓縮系統,其特征在于,所述編輯誤差信息序列用{offset,?edit?type,?symbol}?的格式進行編碼;其中offset為編輯操作堿基的位置,edit?type為操作類型符號:S表示替換、D表示刪除、I表示插入,symbol為操作的堿基符號。
6.一種DNA序列數據壓縮方法,其特征在于,包括以下步驟:?
S100、數據輸入;
S200、檢測輸入的數據是否為原始DNA序列數據,如果是,執行S300,如果否,執行S400;
S300、檢測輸入的數據是否包含MA-ARV碼本,如果是,執行S311,如果否,執行S321;
S311、進入DNA序列數據壓縮模塊,根據MA-ARV碼本對輸入數據進行無損壓縮編碼;
S312、最后輸出壓縮后的DNA序列數據;
S321、進入MA-ARV碼本設計模塊,構造針對當前輸入DNA序列數據的壓縮碼本,然后執行S311;
S400、進入DNA序列數據解壓模塊,對壓縮后的數據文件進行解壓恢復操作;
S410、最后輸出解壓恢復的原始DNA序列數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳大學,未經深圳大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110002601.2/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





