[發(fā)明專利]蛋白質數(shù)據(jù)特征提取方法有效
| 申請?zhí)枺?/td> | 202010106311.1 | 申請日: | 2020-02-21 |
| 公開(公告)號: | CN111414802B | 公開(公告)日: | 2023-06-27 |
| 發(fā)明(設計)人: | 魏志強;聶婕;劉安安;聶為之;蘇育挺 | 申請(專利權)人: | 青島海洋科技中心 |
| 主分類號: | G06V10/422 | 分類號: | G06V10/422;G06V20/64;G06V10/82;G06N3/0464;G06N3/047;G06N3/08 |
| 代理公司: | 青島聯(lián)智專利商標事務所有限公司 37101 | 代理人: | 王艷珍 |
| 地址: | 266000 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 蛋白質 數(shù)據(jù) 特征 提取 方法 | ||
本發(fā)明公開了一種蛋白質數(shù)據(jù)特征提取方法,包括以下步驟:(1)、對蛋白質的原始三維模型進行預處理,得到預處理三維模型;(2)、獲取預處理三維模型的多個二維視圖,提取各所述二維視圖的圖像特征矩陣,將所有的圖像特征矩陣進行融合,得到蛋白質的二維特征矩陣;(3)、獲取蛋白質的三維特征矩陣;(4)、將蛋白質的二維特征矩陣和三維特征矩陣進行融合計算,得到蛋白質數(shù)據(jù)特征矩陣。本發(fā)明的方法通過提取蛋白質的二維視圖特征信息和三維模型空間結構信息,使得對蛋白質的外形特征描述更加全面。通避免了僅采用二維提取特征信息不完整,能夠保證計算蛋白質模型相似度的科學性和準確性。
技術領域
本發(fā)明屬于數(shù)據(jù)處理技術領域,具體地說,涉及一種蛋白質數(shù)據(jù)特征提取方法。
背景技術
蛋白質分子的數(shù)據(jù)庫迅速增加,由于蛋白質在溶液中顯示出多種可能的構象,因此形狀相似性和同一性的檢測在藥物發(fā)現(xiàn)過程和疾病的分子特性中具有生物學相關性。因此學習如何表示和突出蛋白質三維模型的特征對醫(yī)療領域和生物領域都具有重要意義。
目前蛋白質特征的提取方法主要分為兩種,一種是基于三維立體模型的蛋白質特征提取方法,一種是基于多視圖的蛋白質特征提取方法。
在基于三維立體模型的蛋白質特征提取方法中,蛋白質被描述為基于模型的特征,例如體積描述符、表面分布和表面幾何特征。基于模型的方法的一個優(yōu)點是它們可以保存蛋白質的全局空間信息。雖然基于模型的方法是有效的,但它們明確需要蛋白質立體模型信息,且特征提取采用三維卷積計算量大。
在基于多視圖的蛋白質特征提取方法中,蛋白質模型特征被表示成一組不同方向上的二維圖像特征的組合。基于視圖的方法受益于現(xiàn)有的圖像處理和匹配技術。這些方法使得立體對象檢索更靈活,因為它們不需要立體模型信息。與基于模型的方法相比,基于視圖的方法的一個缺點是很難描述不同視圖之間的空間關系,而蛋白質微小的空間差異就會導致蛋白質性質很大的差別。
發(fā)明內(nèi)容
本發(fā)明針對現(xiàn)有技術中蛋白質特征提取方式單采用三維立體模型提取存在計算量大、采用二維特征提取時精度不高,容易丟失空間信息的技術問題,提出了一種蛋白質數(shù)據(jù)特征提取方法,可以解決上述問題。
為實現(xiàn)上述發(fā)明目的,本發(fā)明采用下述技術方案予以實現(xiàn):
一種蛋白質數(shù)據(jù)特征提取方法,包括以下步驟:
(1)、對蛋白質的原始三維模型進行預處理,包括數(shù)據(jù)類型轉換和數(shù)據(jù)大小標準化,得到預處理三維模型;
(2)、獲取預處理三維模型的多個二維視圖,提取各所述二維視圖的圖像特征矩陣,將所有的圖像特征矩陣進行融合,得到蛋白質的二維特征矩陣;
(3)、對預處理三維模型進行特征提取,獲取蛋白質的三維特征矩陣;
(4)、將蛋白質的二維特征矩陣和三維特征矩陣進行融合計算,得到蛋白質數(shù)據(jù)特征矩陣。
進一步的,步驟(1)中對蛋白質的原始三維模型進行預處理方法包括:將原始三維模型轉換為可視化讀取文件,以及將原始三維模型的數(shù)據(jù)大小進行縮小或者放大,轉換為設定的標準值。
進一步的,步驟(2)中所獲取的二維視圖至少覆蓋所述預處理三維模型的全部外表面,各二維視圖的大小相等。
進一步的,步驟(2)中提取各所述二維視圖的圖像特征矩陣的方法為:利用卷積神經(jīng)網(wǎng)絡分別提取所述二維視圖的圖像特征矩陣。
進一步的,步驟(2)中將所有的圖像特征矩陣進行融合的方法為:將所有圖像特征矩陣中同一位置的值進行比較,找出最大值作為該位置的值,得到一個二維矩陣即為蛋白質的二維特征矩陣。
進一步的,步驟(3)中蛋白質的三維特征矩陣的獲取方法為:
(31)、將預處理三維模型映射到離散的體素坐標中,構建蛋白質的體素占用網(wǎng)格模型;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于青島海洋科技中心,未經(jīng)青島海洋科技中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010106311.1/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結構
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





