[發明專利]一種基于密碼子突變位點檢測氨基酸突變的方法在審
| 申請號: | 202110582098.6 | 申請日: | 2021-05-26 |
| 公開(公告)號: | CN113380325A | 公開(公告)日: | 2021-09-10 |
| 發明(設計)人: | 劉文佳;應南嬌;李姍珊;邵夢潔 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G16B20/50 | 分類號: | G16B20/50;G16B20/20;G16B40/00 |
| 代理公司: | 杭州杭誠專利事務所有限公司 33109 | 代理人: | 劉正君 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 密碼子 突變 檢測 氨基酸 方法 | ||
本發明公開了一種基于密碼子突變位點檢測氨基酸突變的方法,其特征是,包括如下步驟:步驟S1:首先將數據進行預處理,獲取原始密碼子數據集C1;步驟S2:通過CMD算法獲取單個堿基突變后的密碼子數據集C2;步驟S3:通過CMD算法獲得氨基酸數據集S1和S2;步驟S4:對氨基酸數據集S1和S2進行比對;步驟S5:輸出氨基酸突變數據。本發明基于CMD密碼子突變檢測的機器學習算法對檢測氨基酸突變進行檢測,效率高且節約成本。本發明提出的CMD算法考慮了氨基酸的突變誘因,在理論上提高了檢測的可信度。通過定位堿基突變來定位突變氨基酸,提高檢測準確度。
技術領域
本發明涉及一種機器學習技術領域,尤其涉及一種基于密碼子突變位點檢測氨基酸突變的方法。
背景技術
氨基酸突變是由一些單個堿基的改變導致的。氨基酸突變包括同義突變,非同義突變和無義突變。同義突變表示單個堿基的改變并不影響其氨基酸序列翻譯的蛋白質。非同義突變則表示單個堿基的改變會影響其氨基酸序列翻譯的蛋白質,會改變蛋白質的穩定性、蛋白質之間的相互作用以及酶的活性,從而導致疾病的發生。最新的全人類基因組測序的結果表明,每個人都會有300-500萬個氨基酸突變,這一數據仍在迅速增長。隨著單核苷酸多態性等位基因分型和下一代DNA測序技術等基因組分析技術的快速發展,產生了大量關于氨基酸突變的數據。研究發現,絕大多數的氨基酸突變都會導致疾病發生。目前通過生物實驗來測定突變表型和生物性質比較耗時耗力,且成本較高。采用機器學習的方法對突變數據進行檢測,可以提高檢測效率和準確性,且節約了大量成本。
已知密碼子是指信使RNA分子中每相鄰的三個核苷酸編成一組,在蛋白質合成時,代表某一種氨基酸的規律。信使RNA在細胞中能決定蛋白質分子中的氨基酸種類和排列次序。在信使RNA分子上的三個堿基能決定一個氨基酸。
目前使用機器學習算法和統計原理對氨基酸突變進行檢測的方法包括:FunSAV、PolyPhen2、SIFT、SNAP和SusPect等。這些方法以氨基酸序列、3D結構、氨基酸的理化性質和進化信息等特征作為輸入,已被做成軟件或者網站供研究使用。但現有的方法檢測精度不高,還需要進一步的改善。
例如,一種在中國專利文獻上公開的“檢測氨基酸突變的方法及系統”,其公告號CN106650314A,包括:構建蛋白質樣本集;確定預篩選的特征,將同一樣本的各個特征值整合到一條特征序列中組合構造成樣本的初始特征集合;通過穩定性特征選擇算法篩選出比較重要特征組合構造成樣本的第一次篩選特征集合;然后通過序列前向選擇算法篩選出重要特征組合構成樣本的最終篩選特征集合;抽取正樣本和負樣本構建訓練集和獨立測試集,將訓練集中各樣本的最終篩選特征集合代入梯度提升樹算法中進行訓練,得出最終的分類模型,并結合獨立測試集的最終篩選特征集合對分類模型的檢測結果進行評估。但是,上述方案建立的訓練方法需采取大量數據形成數據集,存在檢測算法復雜,所需成本較高的問題。
發明內容
本發明是為了解決現有技術對氨基酸突變的檢測方法采用生物實驗來測定突變表型和生物性質,具有較高的盲目性耗時耗力,且成本較高的問題,提供一種基于密碼子突變位點的CMD機器學習方法來檢測氨基酸突變,提高氨基酸突變檢測的效率和準確性.
為實現上述目的,本發明采用以下技術方案:
一種基于密碼子突變位點檢測氨基酸突變的方法,其特征是,包括如下步驟:
步驟S1:首先將數據進行預處理,獲取原始密碼子數據集C1;
步驟S2:通過CMD算法獲取單個堿基突變后的密碼子數據集C2;
步驟S3:通過CMD算法獲得氨基酸數據集S1和S2;
步驟S4:對氨基酸數據集S1和S2進行比對;
步驟S5:輸出氨基酸突變數據。
作為優選,所述密碼子數據集C1中儲存了堿基位點信息,所述堿基位點信息包括:堿基位點所在的位置、堿基位點的起始位點、堿基位點的終止位點。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110582098.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種齒輪熱處理系統
- 下一篇:一種吊裝結構穩固的無極調光式吊燈





