[發明專利]一種基因蛋白質序列關系分析系統及方法無效
| 申請號: | 201210492701.2 | 申請日: | 2012-11-27 |
| 公開(公告)號: | CN102968577A | 公開(公告)日: | 2013-03-13 |
| 發明(設計)人: | 史衛峰;柏佳寧;李先斌;凌誠;郭雪平;鄭為民;黃錫鴻 | 申請(專利權)人: | 廣州中國科學院先進技術研究所 |
| 主分類號: | G06F19/16 | 分類號: | G06F19/16 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 譚英強 |
| 地址: | 511458 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基因 蛋白質 序列 關系 分析 系統 方法 | ||
技術領域
本發明涉及生物技術領域,尤其涉及一種基因蛋白質序列關系分析系統及方法。
背景技術
由于生物數據的復雜性和高維性,既不能以數字公式表示,也不能以邏輯公式表示,故對這些序列的研究大多是基于統計工具。此外,通過數據的可視化,幫助人們認識和理解生物序列,進而分析和解釋數據,使人們從表面上看來是雜亂無章的海量數據中找出隱藏的規律,為科學發現提供依據。所以,現在很多學者都開始借助各種可視化工具,以圖、樹、方體、鏈的形式展現其復雜結構和序列模式,以求直觀地表達生物序列的理論結構與區別。同時,將經過數據挖掘工具得到的數據結果也以圖形、圖像的形式展現給用戶,便于用戶尋找數據間的規律和關系。序列的背景信息對于研究序列的進化關系與分類非常關鍵。然而,目前的工具,均不能利用序列的背景信息和自由選擇分析的算法,導致結果的分析與解釋不容易進行。而且顯示結果只能以一種顏色的方式來表現,用戶不能任意改變顏色設置,對用戶造成極大的不便。
發明內容
為了解決上述技術問題,本發明的目的是提供一種能自由選擇分析算法,并且能更直觀地顯示結果的一種基因蛋白質序列關系分析系統。
本發明的另一個目的是提供一種能自由選擇分析算法,并且能更直觀地顯示結果的一種基因蛋白質序列關系分析方法。
本發明所采用的技術方案是:
一種基因蛋白質序列關系分析系統,包括:
文件選擇模塊,用于選擇要讀取的文件;
序列文件分析模塊,用于對序列文件進行分析;
序列距離分析模塊,用于計算序列間的距離,得出距離關系矩陣;
MDS分析模塊,用于對距離關系矩陣進行分析;
結果顯示模塊,用于對分析的結果進行分類和顯示。
作為所述的一種基因蛋白質序列關系分析系統的進一步改進,所述的序列文件分析模塊包括:
文件讀取模塊,用于讀取序列文件;
頭文件分析模塊,用于將頭文件存入數據結構,并對其進行分隔;
字段選擇模塊,用于選擇后續結果顯示時需要的字段。
作為所述的一種基因蛋白質序列關系分析系統的進一步改進,所述的MDS分析模塊包括:
算法選擇模塊,用于選擇要調用的算法;
降維模塊,用于對距離關系矩陣進行降維。
作為所述的一種基因蛋白質序列關系分析系統的進一步改進,所述的結果顯示模塊包括:
標識選擇模塊,用于選擇標識的形狀和顏色;
序列顯示模塊,用于以選擇的形狀和顏色標識出各個序列在二維坐標系中的位置;
序列分類模塊,用于對序列進行分類。
本發明所采用的另一個技術方案是:
一種基因蛋白質序列關系分析方法,包括以下步驟:
A、選擇要讀取的文件;
B、對序列文件進行分析;
C、計算序列間的距離,得出距離關系矩陣;
D、對距離關系矩陣進行分析;
E、對分析的結果進行分類和顯示。
作為所述的一種基因蛋白質序列關系分析方法的進一步改進,所述的步驟B包括:
B1、讀取序列文件;
B2、將頭文件存入數據結構,并對其進行分隔;
B3、選擇后續結果顯示時需要的字段。
作為所述的一種基因蛋白質序列關系分析方法的進一步改進,所述的步驟D包括:
D1、選擇要調用的算法;
D2、對距離關系矩陣進行降維。
作為所述的一種基因蛋白質序列關系分析方法的進一步改進,所述的步驟E包括:
E1、選擇標識的形狀和顏色;
E2、以選擇的形狀和顏色標識出各個序列在二維坐標系中的位置;
E3、對序列進行分類。
本發明的有益效果是:
本發明一種基因蛋白質序列關系分析系統,通過文件選擇模塊、序列文件分析模塊、序列距離分析模塊、MDS分析模塊和結果顯示模塊,選擇要讀取的文件,對序列文件進行分析,計算序列間的距離,得出距離關系矩陣,對距離關系矩陣進行分析,對分析的結果進行分類和顯示,使得用戶可以根據需求選擇合適的算法進行降維,從而避免損失必要的信息,能單獨對序列背景信息進行挖掘和分類,并且提供了多種圖形以及豐富的顏色供用戶自由選擇,從而能更好更直觀地顯示序列的背景信息。
本發明的另一個有益效果是:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州中國科學院先進技術研究所,未經廣州中國科學院先進技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210492701.2/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





