[發(fā)明專利]一種對(duì)組裝序列排序的方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201910270433.1 | 申請(qǐng)日: | 2019-04-04 |
| 公開(kāi)(公告)號(hào): | CN110020726B | 公開(kāi)(公告)日: | 2023-08-18 |
| 發(fā)明(設(shè)計(jì))人: | 李凈凈;易嘉成;胡江;汪德鵬 | 申請(qǐng)(專利權(quán))人: | 武漢希望組生物科技有限公司 |
| 主分類號(hào): | G06N3/123 | 分類號(hào): | G06N3/123;G06F18/23 |
| 代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 430000 湖北省武漢市東湖新技術(shù)開(kāi)*** | 國(guó)省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 組裝 序列 排序 方法 系統(tǒng) | ||
1.一種對(duì)組裝序列排序的方法,其特征在于,該方法包括:
對(duì)DNA測(cè)序片段進(jìn)行組裝后的目標(biāo)重疊群進(jìn)行切分處理,獲得目標(biāo)數(shù)據(jù);
對(duì)所述目標(biāo)數(shù)據(jù)進(jìn)行定向和排序處理,獲得若干個(gè)排列結(jié)果,包括:遍歷所有目標(biāo)重疊群,分別以該重疊群的首尾兩個(gè)切分序列作為所述重疊群的起始位置,將所述起始位置對(duì)應(yīng)的切分序列記為第一序列;依據(jù)切分序列之間的交聯(lián)信號(hào)強(qiáng)度,依次確定排列在所述第一序列之后的切分序列,獲得若干個(gè)排列結(jié)果;
依據(jù)每個(gè)排列結(jié)果中任意兩個(gè)切分序列之間的距離,和所述兩個(gè)切分序列的交聯(lián)信號(hào)強(qiáng)度計(jì)算每種排列結(jié)果的交聯(lián)信號(hào)強(qiáng)度的離散程度,并依據(jù)每個(gè)排列結(jié)果中進(jìn)行排序的切分序列的數(shù)量和切分序列的總數(shù)量計(jì)算獲得所述目標(biāo)數(shù)據(jù)中的切分序列的掛載率,所述切分序列表征對(duì)所述目標(biāo)重疊群按照預(yù)設(shè)切分長(zhǎng)度進(jìn)行切分后的序列;
依據(jù)所述離散程度和所述掛載率,確定初始排列結(jié)果;
將所述初始排列結(jié)果進(jìn)行互作熱圖驗(yàn)證,若滿足預(yù)設(shè)驗(yàn)證條件,則將所述初始排列結(jié)果確定為目標(biāo)排列,若不滿足,則對(duì)所述初始排列結(jié)果進(jìn)行調(diào)整,獲得目標(biāo)排列。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)DNA測(cè)序片段進(jìn)行組裝后的目標(biāo)重疊群進(jìn)行切分處理,獲得目標(biāo)數(shù)據(jù),包括:
將染色質(zhì)三維構(gòu)象測(cè)序序列比對(duì)到所述目標(biāo)重疊群上,根據(jù)所述目標(biāo)重疊群之間的交聯(lián)信號(hào)強(qiáng)度進(jìn)行聚類處理,獲得若干個(gè)聚類組;
對(duì)每個(gè)所述聚類組中的目標(biāo)重疊群,按照預(yù)設(shè)切分長(zhǎng)度進(jìn)行切分處理,獲得切分序列。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)DNA測(cè)序片段進(jìn)行組裝后的目標(biāo)重疊群進(jìn)行切分處理,獲得目標(biāo)數(shù)據(jù),包括:
對(duì)所述目標(biāo)重疊群按照預(yù)設(shè)切分長(zhǎng)度進(jìn)行切分處理,獲得切分序列;
將染色質(zhì)三維構(gòu)象測(cè)序序列比對(duì)到所述切分序列上,根據(jù)每個(gè)切分序列之間的交聯(lián)信號(hào)強(qiáng)度對(duì)所述切分序列進(jìn)行聚類,獲得若干個(gè)聚類組。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)DNA測(cè)序片段進(jìn)行組裝后的目標(biāo)重疊群進(jìn)行切分處理,獲得目標(biāo)數(shù)據(jù),包括:
將染色質(zhì)三維構(gòu)象測(cè)序序列比對(duì)到所述目標(biāo)重疊群上,并對(duì)所述目標(biāo)重疊群按照預(yù)設(shè)切分長(zhǎng)度進(jìn)行切分處理,獲得切分序列;
根據(jù)每個(gè)切分序列之間的交聯(lián)信號(hào)強(qiáng)度對(duì)所述切分序列進(jìn)行聚類,獲得若干個(gè)聚類組。
5.根據(jù)權(quán)利要求1-4中任意一項(xiàng)所述的方法,其特征在于,所述目標(biāo)重疊群為針對(duì)整個(gè)基因組的重疊群或者待處理的部分基因組的重疊群。
6.根據(jù)權(quán)利要求3或4所述的方法,其特征在于,該方法包括:
響應(yīng)于目標(biāo)重疊群中聚類到目標(biāo)聚類組的切分序列數(shù)量大于預(yù)設(shè)數(shù)量閾值,將所述目標(biāo)重疊群劃分至所述目標(biāo)聚類組;
若所述目標(biāo)重疊群中達(dá)到預(yù)設(shè)位置閾值對(duì)應(yīng)的位置連續(xù)的切分序列被劃分至不同的聚類組,將所述目標(biāo)重疊群根據(jù)切分序列的位置進(jìn)行切分,并將切分后的重疊群劃分至對(duì)應(yīng)的聚類組。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述計(jì)算每種排列結(jié)果的交聯(lián)信號(hào)強(qiáng)度的離散程度,并計(jì)算獲得所述目標(biāo)數(shù)據(jù)中的切分序列的掛載率,包括:
依據(jù)每個(gè)排列結(jié)果中進(jìn)行排序的切分序列的數(shù)量和切分序列的總數(shù)量,計(jì)算獲得切分序列的掛載率;
依據(jù)每個(gè)排列結(jié)果中任意兩個(gè)切分序列之間的距離,和所述兩個(gè)切分序列的交聯(lián)信號(hào)強(qiáng)度,計(jì)算獲得所述離散程度。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述依據(jù)所述離散程度和所述掛載率,確定初始排列結(jié)果,包括:
根據(jù)所述掛載率,確定候選排列結(jié)果;
將所述候選排列結(jié)果中所述離散程度最小的排列結(jié)果,確定為初始排列結(jié)果。
9.一種對(duì)組裝序列排序的系統(tǒng),其特征在于,該系統(tǒng)包括:
切分單元,用于對(duì)DNA測(cè)序片段進(jìn)行組裝后的目標(biāo)重疊群進(jìn)行切分處理,獲得目標(biāo)數(shù)據(jù);
排序單元,用于對(duì)所述目標(biāo)數(shù)據(jù)進(jìn)行定向和排序處理,獲得若干個(gè)排列結(jié)果;
所述排序單元,具體用于遍歷所有目標(biāo)重疊群,分別以該重疊群的首尾兩個(gè)切分序列作為所述重疊群的起始位置,將所述起始位置對(duì)應(yīng)的切分序列記為第一序列;依據(jù)切分序列之間的交聯(lián)信號(hào)強(qiáng)度,依次確定排列在所述第一序列之后的切分序列,獲得若干個(gè)排列結(jié)果;
計(jì)算單元,用于依據(jù)每個(gè)排列結(jié)果中任意兩個(gè)切分序列之間的距離,和所述兩個(gè)切分序列的交聯(lián)信號(hào)強(qiáng)度計(jì)算每種排列結(jié)果的交聯(lián)信號(hào)強(qiáng)度的離散程度,并依據(jù)每個(gè)排列結(jié)果中進(jìn)行排序的切分序列的數(shù)量和切分序列的總數(shù)量計(jì)算獲得所述目標(biāo)數(shù)據(jù)中的切分序列的掛載率,所述切分序列表征對(duì)所述目標(biāo)重疊群按照預(yù)設(shè)切分長(zhǎng)度進(jìn)行切分后的序列;
確定單元,用于依據(jù)所述離散程度和所述掛載率,確定初始排列結(jié)果;
驗(yàn)證單元,用于將所述初始排列結(jié)果進(jìn)行互作熱圖驗(yàn)證,若滿足預(yù)設(shè)驗(yàn)證條件,則將所述初始排列結(jié)果確定為目標(biāo)排列,若不滿足,則對(duì)所述初始排列結(jié)果進(jìn)行調(diào)整,獲得目標(biāo)排列。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢希望組生物科技有限公司,未經(jīng)武漢希望組生物科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910270433.1/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





