[發明專利]一種基于堿基序列匹配分組的免疫細胞受體轉錄組多樣性檢測多重引物智能選擇方法在審
| 申請號: | 202110996862.4 | 申請日: | 2021-08-27 |
| 公開(公告)號: | CN113707220A | 公開(公告)日: | 2021-11-26 |
| 發明(設計)人: | 魏平;張翼冠 | 申請(專利權)人: | 云測醫學科技(深圳)有限公司 |
| 主分類號: | G16B20/30 | 分類號: | G16B20/30;G06F30/20;G06F111/06 |
| 代理公司: | 成都瑞創華盛知識產權代理事務所(特殊普通合伙) 51270 | 代理人: | 鄧瑞;張敏 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 堿基 序列 匹配 分組 免疫 細胞 受體 轉錄 多樣性 檢測 多重 引物 智能 選擇 | ||
1.一種基于堿基序列匹配分組的免疫細胞受體轉錄組多樣性檢測多重引物智能選擇方法,其特征在于,包括以下步驟:
S1:對于m條FR3堿基序列Si(i=1,2,...,m),采用滑動窗口將每條序列切分成不同長度的連續子串,得到所有序列不同長度的子串集;
S2:將所述所有序列不同長度的子串集去重,得到去重后的子串集;
S3:通過子串篩選條件(引物長度、退火溫度、CG含量)對所述去重后的子串集中的子串進行篩選,去除不滿足條件的子串后,得到子串集P={p1,p2,...,pn},子串集中某個子串表示為pj(j=1,2,...,n),計算其長度為len(pj);
S4:以所述所有序列Si(i=1,2,...,m)為行,所述子串集pj(j=1,2,...,n)為列,初始化生成m×n階零矩陣M;通過字符串匹配,若所述子串pj(j=1,2,...,n)在所述序列Si(i=1,2,...,m)中,則將所述零矩陣M相應的第i行第j列的0替換為1,生成0-1矩陣M;
S5:計算所述替換后的M矩陣每一列的和gj(j=1,2,...,n);
S6:給所述每一列的和gj權重為w,每列子串長度len(pj)權重為1-w,計算Wj=w×gj+(1-w)×len(pj),選擇最大Wj對應的子串pj,刪除pj列元素值為1所對應的行以及pj列,得到新的矩陣M,輸出所述權重w下對應的第一個目標子串pj;
所述w的取值范圍為0w1;
S7:重復第S5~S6步,直到矩陣M為空,得到一組目標子串集P={pk|k=1,2,...,K};
S8:更改權重w的值,令矩陣M為第S4步中生成的0-1矩陣M,重復第S5~S7步,得到不同權重下的目標子串集,選擇最小K對應的目標子串集,該目標子串集中的子串即為FR3序列的簡并引物。
2.根據權利要求1所述的基于堿基序列匹配分組的免疫細胞受體轉錄組多樣性檢測多重引物智能選擇方法,其特征在于,所述S3步驟中,所述子串篩選條件為:子串序列的GC堿基含量為0.4~0.6,退火溫度為50~60攝氏度。
3.根據權利要求1或2所述的基于堿基序列匹配分組的免疫細胞受體轉錄組多樣性檢測多重引物智能選擇方法,其特征在于,所述S3步驟中,所述子串篩選條件還包括:
子串的各個堿基含量需滿足退火溫度T(℃)區間為50~60攝氏度,退火溫度計算公式如下:
其中,pA、pT、pC、pG分別代表pj中的堿基含量,目標產物長度取200。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于云測醫學科技(深圳)有限公司,未經云測醫學科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110996862.4/1.html,轉載請聲明來源鉆瓜專利網。





