[發(fā)明專利]基于Adaboost、BP神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林融合的mirco-RNA前體識(shí)別方法在審
| 申請(qǐng)?zhí)枺?/td> | 201910141438.4 | 申請(qǐng)日: | 2019-02-26 |
| 公開(kāi)(公告)號(hào): | CN109872773A | 公開(kāi)(公告)日: | 2019-06-11 |
| 發(fā)明(設(shè)計(jì))人: | 胡楊;逄龍;程亮;張凝一;趙天意 | 申請(qǐng)(專利權(quán))人: | 哈爾濱工業(yè)大學(xué) |
| 主分類號(hào): | G16B20/00 | 分類號(hào): | G16B20/00;G06N3/04 |
| 代理公司: | 北京天奇智新知識(shí)產(chǎn)權(quán)代理有限公司 11340 | 代理人: | 范光曄 |
| 地址: | 150001 黑龍*** | 國(guó)省代碼: | 黑龍江;23 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 分類器 強(qiáng)分類器 隨機(jī)森林 權(quán)重 標(biāo)簽建立 權(quán)重分配 弱分類器 算法分類 提取特征 準(zhǔn)確度 融合 擬合 前體 整合 預(yù)測(cè) | ||
1.一種基于Adaboost、BP神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林融合的mirco-RNA前體識(shí)別方法,其特征在于,包括以下步驟:
步驟1:從pre-miRNA序列中提取N個(gè)特征;
步驟2:通過(guò)提取特征及其相應(yīng)的標(biāo)簽建立N/2個(gè)BP分類器和N/2個(gè)RF分類器;
步驟3:在訓(xùn)練和建立分類器時(shí),計(jì)算每個(gè)分類器獲得的相應(yīng)權(quán)重;
步驟4:組合弱權(quán)重分布的分類器獲得強(qiáng)分類器。
2.根據(jù)權(quán)利要求1所述識(shí)別方法,其特征在于,所述步驟1中從pre-miRNA序列中提取N個(gè)特征包括一級(jí)序列特征和二級(jí)序列特征;
所述一級(jí)序列特征為N-Gram頻率,選擇N值為3,在指定序列的三核苷酸組中存在64個(gè)組合,獲得總共64維頻率特征作為N-Gram頻率特征;
所述二級(jí)序列特征包括三重結(jié)構(gòu)序列、堿基對(duì)含量特征和MFE功能;其中,所述三重結(jié)構(gòu)序列為對(duì)于任何三個(gè)核苷酸單元,有8個(gè)可能的組合,考慮三個(gè)字符組的第一個(gè)核苷酸,有32個(gè)不同的組合;所述堿基對(duì)含量特征為miRNA序列中的核苷酸配對(duì)G-C配對(duì)的頻率;MFE功能為最小自由能。
3.根據(jù)權(quán)利要求1所述的識(shí)別方法,其特征在于,所述步驟2中相應(yīng)標(biāo)簽為0表示陰性樣本,1表示陽(yáng)性樣本。
4.根據(jù)權(quán)利要求1所述的識(shí)別方法,其特征在于,所述步驟2中建立N/2個(gè)BP分類器和N/2個(gè)RF分類器的方法為:
對(duì)于給定的多個(gè)分類訓(xùn)練數(shù)組,輸入數(shù)據(jù)T={(x1,y1),…,(xN,yN)},具有任意整數(shù)標(biāo)簽,其中,T代表輸入數(shù)據(jù),x代表特征,y代表分類標(biāo)簽;
首先,初始化訓(xùn)練集權(quán)重,設(shè)置每個(gè)樣品的初始重量為1/N;則權(quán)重表示如下:
然后,通過(guò)RF和BP獲得分類器Gm(x),Gm(x)則代表集成分類器中的弱分類器,共由N個(gè)弱分類器集成,其中BP和RF各N/2個(gè)。
5.根據(jù)權(quán)利要求1所述的識(shí)別方法,其特征在于,所述步驟3的具體步驟為:
計(jì)算Gm(x)的誤差:
得到弱分類器的權(quán)重,如下:
更新樣本權(quán)重:
計(jì)算標(biāo)準(zhǔn)化因子:
重復(fù)上面的過(guò)程,m為弱分類器的標(biāo)號(hào),m取值為1到M,M取N,可以得到多個(gè)分類器和相應(yīng)的權(quán)重。
6.根據(jù)權(quán)利要求1所述的識(shí)別方法,其特征在于,所述步驟4的具體步驟為:計(jì)算得到最終的強(qiáng)分類器,如下:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于哈爾濱工業(yè)大學(xué),未經(jīng)哈爾濱工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910141438.4/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 多類目標(biāo)的檢測(cè)裝置及檢測(cè)方法
- 多類目標(biāo)的檢測(cè)裝置及檢測(cè)方法
- 分類器的訓(xùn)練方法、圖像檢測(cè)方法及各自系統(tǒng)
- 基于分布式計(jì)算與檢測(cè)代價(jià)排序的訓(xùn)練學(xué)習(xí)方法及裝置
- 一種眼睛睜閉狀態(tài)的檢測(cè)方法及系統(tǒng)
- 一種文本分類方法及裝置
- 一種級(jí)聯(lián)分類器訓(xùn)練方法及裝置
- 一種人臉檢測(cè)模型訓(xùn)練方法、裝置和介質(zhì)
- 基于模糊型弱分類器的AdaBoost分類方法
- 遠(yuǎn)程人臉識(shí)別方法及系統(tǒng)
- 一種基于條件隨機(jī)森林的笑臉檢測(cè)器及方法
- 隨機(jī)森林模型訓(xùn)練的方法及模型訓(xùn)練控制系統(tǒng)
- 隨機(jī)森林模型訓(xùn)練方法及裝置
- 基于結(jié)構(gòu)化隨機(jī)森林編碼器的眼底視網(wǎng)膜血管分割方法
- 一種基于隨機(jī)森林模型的慢性肝病風(fēng)險(xiǎn)評(píng)估系統(tǒng)
- 基于改進(jìn)隨機(jī)森林方法的風(fēng)光發(fā)電出力的短期預(yù)測(cè)方法
- 交互式隨機(jī)森林子樹篩選方法、裝置、設(shè)備及可讀介質(zhì)
- 交互式隨機(jī)森林集成方法、設(shè)備及可讀存儲(chǔ)介質(zhì)
- 一種基于深度森林的眼底圖像血管分割方法和系統(tǒng)
- 隨機(jī)森林的生成方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 權(quán)重調(diào)整模塊與權(quán)重調(diào)整方法
- 網(wǎng)頁(yè)主題的分類方法及裝置
- 接收裝置
- 基于權(quán)重濾波的視頻去噪裝置及方法
- 權(quán)重?cái)?shù)據(jù)存儲(chǔ)方法和基于該方法的神經(jīng)網(wǎng)絡(luò)處理器
- 危害因素的權(quán)重因子的確定方法、裝置及存儲(chǔ)介質(zhì)
- 用于優(yōu)化神經(jīng)網(wǎng)絡(luò)的方法
- 處理器
- 用于對(duì)深度神經(jīng)網(wǎng)絡(luò)的權(quán)重進(jìn)行轉(zhuǎn)換的方法和系統(tǒng)
- 神經(jīng)網(wǎng)絡(luò)的量化方法、裝置、服務(wù)器和存儲(chǔ)介質(zhì)





