[發明專利]基于深度圖像特征和閾值學習策略的蛋白質亞細胞定位的方法有效
| 申請號: | 202011148528.5 | 申請日: | 2020-10-23 |
| 公開(公告)號: | CN112201300B | 公開(公告)日: | 2022-05-13 |
| 發明(設計)人: | 蘇苒;何琳琳 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G16B15/20 | 分類號: | G16B15/20;G06N3/04 |
| 代理公司: | 天津創智天誠知識產權代理事務所(普通合伙) 12214 | 代理人: | 李蕊;王秀奎 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 圖像 特征 閾值 學習 策略 蛋白質 細胞 定位 方法 | ||
本發明公開了一種基于深度圖像特征和閾值學習策略的蛋白質亞細胞定位的方法,包括以下步驟:步驟1,數據收集和數據預處理;步驟2,數據增強訓練集測試集劃分;步驟3,構建基于卷積神經網絡的特征提取器;步驟4,利用最小冗余最大相關算法結合后向特征消除進行特征提取;步驟5,構建亞細胞定位分類器;步驟6,性能評價,步驟7,利用單標簽亞細胞定位預測器蛋白質免疫組化單標簽圖像進行預測,利用多標簽亞細胞定位預測器對蛋白質免疫組化多標簽圖像進行預測。本發明引入了閾值學習策略,可以更好的挖掘標簽與樣本以及標簽與標簽之間的相關性使得多標簽蛋白質亞結構的定位預測性能更好。
技術領域
本發明涉及生物信息技術領域,特別是涉及一種基于深度圖像特征和閾值學習策略的蛋白質亞細胞定位的方法。
背景技術
蛋白質亞細胞定位是蛋白質組學研究中最重要的任務之一。細胞中的亞細胞是用于執行特定功能的不同區室,因此蛋白質的亞細胞定位通常與其功能密切相關。我們需要讓蛋白質在正確的時間出現在細胞區室中的正確位置然后在正常細胞中發揮其功能,而蛋白質出現在錯誤的位置可能會導致包括癌癥在內的一些病理性疾病。
目前,已經開發了用于蛋白質的亞細胞自動定位的計算方法。從數據方面來看,Leyi Wei,Hang Zhou等人利用一些計算方法使用一維蛋白質氨基酸序列預測亞細胞定位。與序列數據相比,Ying-Ying Xu等人以不同模式呈現蛋白質或亞細胞定位的2D圖像更加直觀。特別是,隨著成像技術的發展,基于圖像的方法的發展已經取得了相當大的進展,該方法采用手工圖像特征來預測蛋白質的亞細胞定位,可以自動確定蛋白質的亞細胞定位,但是準確率較低。
并且當前的大多數研究都集中在單標簽蛋白質的定位上,實際上,至少20%的人類蛋白質存在于兩個以上的亞細胞定位。一些研究提出了用多個亞細胞結構標記蛋白質的算法。在Xu等人的研究中,使用了二進制相關性(BR)來構建多標簽預測變量,該變量將多定位問題視為多個獨立的二進制分類問題。但是,此方法未考慮類之間的關系。Wang和Li擴展了二進制相關性(BR)方法,并通過特征空間轉換來學習標簽相關性。對于每個標簽,通過隨機選擇幾個標簽作為其附加輸入特征來學習多個二進制分類器,然后通過多數投票策略匯總這些分類器。楊等人運用頻率特征和鏈式預測模型來處理多標簽問題。。但是,預測性能仍在等待改善,因為所有這些方法中的最佳方法仍低于70%。
發明內容
針對現有技術中存在的白質亞細胞的定位準確率低的問題,本發明的目的在于提出一種基于深度圖像特征和閾值學習策略的蛋白質亞細胞定位的方法,使用深度學習進行蛋白質亞細胞的定位有助于準確率的提升。
本發明的目的是通過下述技術方案予以實現的。
一種基于深度圖像特征和閾值學習策略的蛋白質亞細胞定位的方法,包括以下步驟:
步驟1,數據收集和數據預處理:
1-1,準備數據集:所述數據集包括蛋白質免疫組化單標簽圖像I1;蛋白質免疫組化多標簽圖像I2。
1-2,將步驟1-1中所述的蛋白質免疫組化單標簽圖像I1進行線性光譜分離得到所述的蛋白質免疫組化蛋白質通道單標簽圖像P1;將步驟1-1中所述的蛋白質免疫組化多標簽圖像I2進行線性光譜分離得到所述的蛋白質免疫組化蛋白質通道多標簽圖像P2;
步驟2,數據增強和訓練集、測試集劃分:
2-1對步驟1-2中所得的蛋白質免疫組化蛋白質通道單標簽圖像P1進行上下翻轉、左右翻轉和旋轉得到擴充后的數據集P_Aug1;
2-2對步驟1-2中所得的蛋白質免疫組化蛋白質通道多標簽圖像P2進行上下翻轉、左右翻轉和旋轉得到擴充后的數據集P_Aug2;
2-3對步驟2-1中所得的數據集P_Aug1進行劃分得到訓練集Train1和測試集Test1;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011148528.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種汽車以太網外導體裝置及連接器
- 下一篇:園林草坪修割裝置及使用方法
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





