[發(fā)明專利]UID測序、UID序列設(shè)計(jì)、UID去重質(zhì)量值校正的方法及應(yīng)用有效
| 申請(qǐng)?zhí)枺?/td> | 201810450617.1 | 申請(qǐng)日: | 2018-05-11 |
| 公開(公告)號(hào): | CN110491445B | 公開(公告)日: | 2023-05-30 |
| 發(fā)明(設(shè)計(jì))人: | 劉繼龍;劉足;葉明芝;程少敏;譚美華 | 申請(qǐng)(專利權(quán))人: | 廣州華大基因醫(yī)學(xué)檢驗(yàn)所有限公司;深圳華大醫(yī)學(xué)檢驗(yàn)實(shí)驗(yàn)室;深圳華大基因股份有限公司;天津華大醫(yī)學(xué)檢驗(yàn)所有限公司 |
| 主分類號(hào): | G16B20/20 | 分類號(hào): | G16B20/20;G16B20/30 |
| 代理公司: | 深圳鼎合誠知識(shí)產(chǎn)權(quán)代理有限公司 44281 | 代理人: | 李小焦;彭家恩 |
| 地址: | 510006 廣東省廣州市番禺區(qū)大學(xué)城小谷圍*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | uid 測序 序列 設(shè)計(jì) 質(zhì)量 校正 方法 應(yīng)用 | ||
1.一種UID測序方法,其特征在于:包括UID序列設(shè)計(jì)步驟和UID去重質(zhì)量值校正步驟;
所述UID序列設(shè)計(jì)步驟,包括預(yù)先為待測DNA樣本添加8-20bp的UID序列;對(duì)測序結(jié)果進(jìn)行常規(guī)去重,統(tǒng)計(jì)每個(gè)常規(guī)去重的重復(fù)序列組中包含的序列總數(shù);采用UID去重算法對(duì)所述常規(guī)去重的重復(fù)序列組進(jìn)行第二次去重,并統(tǒng)計(jì)每個(gè)常規(guī)去重的重復(fù)序列組中包含的UID組數(shù);將每個(gè)常規(guī)去重的重復(fù)序列組中的序列總數(shù)和對(duì)應(yīng)的UID組數(shù)擬合,獲得兩者的擬合函數(shù);
根據(jù)待測DNA樣本測序需要的常規(guī)去重后的重復(fù)序列組中的序列總數(shù),根據(jù)所述擬合函數(shù),獲得所需的預(yù)期UID組數(shù);
設(shè)UID序列的長度為n,則UID序列的組合數(shù)為4n,以預(yù)期UID組數(shù)為縱坐標(biāo),利用R語言編程,模擬計(jì)算n取不同長度時(shí),將4n種可能的UID序列隨機(jī)添加到預(yù)期UID組數(shù)的原始模板中,確保預(yù)期UID組數(shù)的原始模板都連接不同UID序列的概率在95%或以上的,最小n值,即最佳的UID序列長度,以此長度設(shè)計(jì)所述UID序列;
所述UID去重質(zhì)量值校正步驟,包括在UID去重算法的壓縮去重算法中,每個(gè)位點(diǎn)選取出現(xiàn)比例大于或等于設(shè)定閾值的堿基,利用R語言編程計(jì)算該位點(diǎn)設(shè)定閾值及以上比例的堿基都發(fā)生測序錯(cuò)誤的概率,標(biāo)記為P1;
設(shè)PCR錯(cuò)誤發(fā)生在第j輪,對(duì)應(yīng)的PCR錯(cuò)誤所占比例為fj,對(duì)應(yīng)的PCR錯(cuò)誤率為p,綜合考慮第一輪PCR兩條reads同時(shí)發(fā)生錯(cuò)誤,或者多輪PCR擴(kuò)增都至少有一條發(fā)生錯(cuò)誤的情況,利用R語言編程計(jì)算所有滿足條件的fj和對(duì)應(yīng)的p,如表1所示;
表1
。
2.根據(jù)權(quán)利要求1所述的UID測序方法,其特征在于:
所述滿足條件的fj為PCR錯(cuò)誤所占比例大于或等于所述設(shè)定閾值的fj。
3.根據(jù)權(quán)利要求2所述的UID測序方法,其特征在于:所述設(shè)定閾值為60%。
4.根據(jù)權(quán)利要求1-3任一項(xiàng)所述的UID測序方法,其特征在于:所述常規(guī)去重,具體包括,采用picard軟件根據(jù)比對(duì)位置、比對(duì)方向、片段長度對(duì)重復(fù)序列進(jìn)行標(biāo)記。
5.根據(jù)權(quán)利要求1-3任一項(xiàng)所述的UID測序方法,其特征在于:所述擬合函數(shù)為,y?=0.0053x?+?1.3158
其中,y為常規(guī)去重的重復(fù)序列組中包含的UID組數(shù),x為常規(guī)去重的重復(fù)序列組中包含的序列總數(shù)。
6.根據(jù)權(quán)利要求1-5任一項(xiàng)所述的UID測序方法在UID序列設(shè)計(jì)或UID去重質(zhì)量值校正中的應(yīng)用。
7.一種UID序列設(shè)計(jì)方法,其特征在于:包括預(yù)先為待測DNA樣本添加8-20bp的UID序列;對(duì)測序結(jié)果進(jìn)行常規(guī)去重,統(tǒng)計(jì)每個(gè)常規(guī)去重的重復(fù)序列組中包含的序列總數(shù);采用UID去重算法對(duì)所述常規(guī)去重的重復(fù)序列組進(jìn)行第二次去重,并統(tǒng)計(jì)每個(gè)常規(guī)去重的重復(fù)序列組中包含的UID組數(shù);將每個(gè)常規(guī)去重的重復(fù)序列組中的序列總數(shù)和對(duì)應(yīng)的UID組數(shù)擬合,獲得兩者的擬合函數(shù);
根據(jù)待測DNA樣本測序需要的常規(guī)去重后的重復(fù)序列組中的序列總數(shù),根據(jù)所述擬合函數(shù),獲得所需的預(yù)期UID組數(shù);
設(shè)UID序列的長度為n,則UID序列的組合數(shù)為4n,以預(yù)期UID組數(shù)為縱坐標(biāo),利用R語言編程,模擬計(jì)算n取不同長度時(shí),將4n種可能的UID序列隨機(jī)添加到預(yù)期UID組數(shù)的原始模板中,確保預(yù)期UID組數(shù)的原始模板都連接不同UID序列的概率在95%或以上的,最小n值,即最佳的UID序列長度,以此長度設(shè)計(jì)所述UID序列。
8.一種UID序列設(shè)計(jì)的裝置,其特征在于:所述裝置包括,
擬合函數(shù)獲取模塊,用于利用添加8-20bpUID序列的待測DNA樣本的測序結(jié)果,對(duì)其進(jìn)行常規(guī)去重,統(tǒng)計(jì)每個(gè)常規(guī)去重的重復(fù)序列組中包含的序列總數(shù);利用UID去重算法對(duì)所述常規(guī)去重的重復(fù)序列組進(jìn)行第二次去重,并統(tǒng)計(jì)每個(gè)常規(guī)去重的重復(fù)序列組中包含的UID組數(shù);將每個(gè)常規(guī)去重的重復(fù)序列組中的序列總數(shù)和對(duì)應(yīng)的UID組數(shù)擬合,獲得兩者的擬合函數(shù);
預(yù)期UID組數(shù)獲取模塊,用于利用待測DNA樣本測序需要的常規(guī)去重后的重復(fù)序列組中的序列總數(shù),根據(jù)所述擬合函數(shù),獲得所需的預(yù)期UID組數(shù);
最佳UID序列長度獲取模塊,用于模擬計(jì)算UID序列長度n取不同長度時(shí),將4n種可能的UID序列隨機(jī)添加到預(yù)期UID組數(shù)的原始模板中,確保預(yù)期UID組數(shù)的原始模板都連接不同UID序列的概率在95%或以上的,最小n值,即最佳UID序列長度;
UID去重質(zhì)量值校正模塊,用于在UID去重算法的壓縮去重算法中,每個(gè)位點(diǎn)選取出現(xiàn)比例大于或等于設(shè)定閾值的堿基,利用R語言編程計(jì)算該位點(diǎn)設(shè)定閾值及以上比例的堿基都發(fā)生測序錯(cuò)誤的概率,標(biāo)記為P1;
設(shè)PCR錯(cuò)誤發(fā)生在第j輪,對(duì)應(yīng)的PCR錯(cuò)誤所占比例為fj,對(duì)應(yīng)的PCR錯(cuò)誤率為p,綜合考慮第一輪PCR兩條reads同時(shí)發(fā)生錯(cuò)誤,或者多輪PCR擴(kuò)增都至少有一條發(fā)生錯(cuò)誤的情況,利用R語言編程計(jì)算所有滿足條件的fj和對(duì)應(yīng)的p,如表1所示;
表1
。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州華大基因醫(yī)學(xué)檢驗(yàn)所有限公司;深圳華大醫(yī)學(xué)檢驗(yàn)實(shí)驗(yàn)室;深圳華大基因股份有限公司;天津華大醫(yī)學(xué)檢驗(yàn)所有限公司,未經(jīng)廣州華大基因醫(yī)學(xué)檢驗(yàn)所有限公司;深圳華大醫(yī)學(xué)檢驗(yàn)實(shí)驗(yàn)室;深圳華大基因股份有限公司;天津華大醫(yī)學(xué)檢驗(yàn)所有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810450617.1/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種多用戶動(dòng)態(tài)關(guān)鍵詞可搜索加密方法
- 一種燈具運(yùn)用RDM功能燒錄UID碼的方法
- 一種無線終端之間綁定的方法
- 一種系統(tǒng)的優(yōu)化方法、移動(dòng)終端及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- UID測序、UID序列設(shè)計(jì)、UID去重質(zhì)量值校正的方法及應(yīng)用
- 一種可實(shí)現(xiàn)UID-LED多狀態(tài)控制的方法
- UID按鍵的復(fù)用方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 服務(wù)器UID LED指示燈控制方法及系統(tǒng)
- 一種推薦相似簡歷的方法
- 一種基于區(qū)塊鏈的用戶自授權(quán)的方法
- 針織設(shè)計(jì)裝置和設(shè)計(jì)方法、設(shè)計(jì)程序
- 燈具(設(shè)計(jì)1?設(shè)計(jì)3)
- 頭燈(設(shè)計(jì)1?設(shè)計(jì)2?設(shè)計(jì)3)
- LED透鏡(設(shè)計(jì)1、設(shè)計(jì)2、設(shè)計(jì)3)
- 設(shè)計(jì)用圖形設(shè)計(jì)桌
- 手機(jī)殼(設(shè)計(jì)1設(shè)計(jì)2設(shè)計(jì)3設(shè)計(jì)4)
- 機(jī)床鉆夾頭(設(shè)計(jì)1設(shè)計(jì)2設(shè)計(jì)3設(shè)計(jì)4)
- 吹風(fēng)機(jī)支架(設(shè)計(jì)1設(shè)計(jì)2設(shè)計(jì)3設(shè)計(jì)4)
- 設(shè)計(jì)桌(平面設(shè)計(jì))
- 設(shè)計(jì)臺(tái)(雕塑設(shè)計(jì)用)





