[發明專利]在目標基因組序列中產生新型序列的裝置和方法有效
| 申請號: | 201210428087.3 | 申請日: | 2012-10-31 |
| 公開(公告)號: | CN103087906A | 公開(公告)日: | 2013-05-08 |
| 發明(設計)人: | 洪侑辰;李勇錫;申守容 | 申請(專利權)人: | 三星SDS株式會社 |
| 主分類號: | C12M1/34 | 分類號: | C12M1/34;C12Q1/68 |
| 代理公司: | 北京銘碩知識產權代理有限公司 11286 | 代理人: | 韓明星 |
| 地址: | 韓國*** | 國省代碼: | 韓國;KR |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標 基因組 序列 產生 新型 裝置 方法 | ||
本申請要求于2011年10月31日在韓國知識產權局提交的第10-2011-0112371號韓國專利申請的權益,該韓國專利申請的公開通過引用全部包含于此。
技術領域
本發明涉及在目標基因組序列中產生新型序列的裝置和方法,更具體地講,涉及這樣一種在目標基因組序列中產生新型序列的裝置和方法,其用于在下一代測序(NGS)技術的基因組重測序過程中通過使用沒有與參考序列比對上的輸入短片段產生在參考序列中不存在的新型序列。
背景技術
NGS技術在對目標基因組測序時產生大量的短片段(其為短的片段)。將產生的短片段與參考序列比對,并用比對上短片段的共有序列重構目標基因組的堿基序列,該工藝稱作重測序。因此,基于參考序列制備通過重測序產生的個別的基因組序列。
因此,目前,NGS數據同與參考序列比對上的短片段的共有序列一起構成目標基因組序列。
然而,由于重測序的方法的限制,在參考序列中不存在或與參考序列不同的個別的基因組序列中,在相應的序列中產生的短片段可能沒有與參考序列比對上,因此,個別的遺傳特征可能不會充分地反映在根據重測序的結果重構的個別的基因組序列中。因此,為了獲得與參考序列不同的個別的遺傳特征的信息,雖然需要對在重測序過程中未比對上的短片段進行另外的分析,但通常將該短片段從分析中排除。然而,已知的是,在個別的基因組中個別地示出的變異可以解釋與表型變異和疾病易感性相關的個別的遺傳特征,因此,找到該變異非常重要。
然而,僅通過使用傳統的重測序方法難以產生具有以下特征的序列:與在參考序列中不存在并且獨特地插入到個別的基因組中的部分對應;或者,與在參考序列中存在并且因諸如變異的因素而在個別的基因組中表現不同的部分對應。此外,僅通過使用傳統重測序方法不能解決沒有與參考序列比對上的短片段的個別的基因組的信息丟失的問題。
發明內容
本發明提供了在目標基因組序列中產生新型序列的裝置和方法,其用于在下一代測序(在下文中,稱作NGS)技術的基因組重測序過程中通過使用沒有與參考序列比對上的輸入短片段產生在參考序列中不存在的新型序列。
根據本發明的一方面,提供了一種新型序列產生裝置,包括:短片段對獲得單元,獲得分別包括至少一個未比對上短片段的短片段對,所述至少一個未比對上短片段根據重測序的結果而沒有與參考序列比對上,重測序用于將從基因組序列測序儀接收的輸入短片段與參考序列進行比對;重疊群產生單元,產生通過將所獲得的短片段對的未比對上短片段進行連接而組裝的重疊群;新型序列產生單元,產生包括來自產生的重疊群之中的至少一個重疊群的新型序列;以及位置預測單元,預測產生的新型序列在參考序列上的位置。
短片段對可以包括比對上-未比對上短片段對和未比對上-未比對上短片段對,比對上-未比對上短片段對分別由與參考序列比對上的比對上短片段中的一個與未比對上短片段中的一個的對組成,未比對上-未比對上短片段分別由未比對上短片段的對組成。
重疊群可以包括一個或多個第一重疊群和一個或多個第二重疊群,通過將比對上-未比對上短片段對的未比對上短片段連接來組裝所述一個或多個第一重疊群,通過將未比對上-未比對上短片段對的未比對上短片段連接來組裝所述一個或多個第二重疊群。
新型序列可以包括第一新型序列和第二新型序列,通過將所述一個或多個第一重疊群之中的比對上-未比對上短片段對的比對上短片段的方向性相同的第一重疊群與第二重疊群連接獲得第一新型序列,第二新型序列基于比對上-未比對上短片段對的比對上短片段的方向性不同的第一重疊群。
新型序列產生單元可以基于與產生的重疊群對應的比對上-未比對上短片段對的比對上短片段的比對質量、構成產生的重疊群的短片段的平均堿基質量以及產生的重疊群的長度來篩選產生的重疊群。
位置預測單元可以基于比對上短片段在參考序列上的位置預測新型序列在參考序列上的位置,比對上短片段來自用于產生新型序列中包括的重疊群的短片段對的短片段之中,比對上短片段與參考序列比對上。
新型序列產生裝置還可以包括類型預測單元,類型預測單元基于與新型序列在參考序列上的預測的位置和由所述預測的位置指示的區域比對上的短片段的覆蓋深度來預測新型序列的類型,新型序列的類型包括變異新型序列和插入新型序列中的至少一個,變異新型序列存在于參考序列上但表現出與通過重測序重構的目標基因組序列中的參考序列不同,插入新型序列從參考序列單獨地插入。
新型序列產生裝置還可以包括新型序列輸出單元,新型序列輸出單元用于輸出關于新型序列的預測的位置和預測的類型的信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于三星SDS株式會社,未經三星SDS株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210428087.3/2.html,轉載請聲明來源鉆瓜專利網。





