[發(fā)明專利]一種基因合成致死關(guān)聯(lián)預(yù)測方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010511252.6 | 申請(qǐng)日: | 2020-06-08 |
| 公開(公告)號(hào): | CN111863123B | 公開(公告)日: | 2023-07-28 |
| 發(fā)明(設(shè)計(jì))人: | 歐陽樂;林奕龍 | 申請(qǐng)(專利權(quán))人: | 深圳大學(xué) |
| 主分類號(hào): | G16B20/00 | 分類號(hào): | G16B20/00;G16B40/00;G16B50/30 |
| 代理公司: | 廣州粵高專利商標(biāo)代理有限公司 44102 | 代理人: | 張金福 |
| 地址: | 518060 廣東省深*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基因 合成 致死 關(guān)聯(lián) 預(yù)測 方法 | ||
本發(fā)明涉及一種基因合成致死關(guān)聯(lián)預(yù)測方法,包括:S1:確定并使用多標(biāo)簽學(xué)習(xí)損失函數(shù);S2:對(duì)多標(biāo)簽學(xué)習(xí)損失函數(shù)設(shè)置圖正則化懲罰項(xiàng);得到圖正則化多標(biāo)簽學(xué)習(xí)模型;S3:利用多視角信息重新構(gòu)建S2中的圖正則化多標(biāo)簽學(xué)習(xí)模型,確定自適應(yīng)加權(quán)多視角模型;S4:對(duì)自適應(yīng)多視角模型進(jìn)行求解,實(shí)現(xiàn)基因合成致死關(guān)聯(lián)的預(yù)測。本發(fā)明所述方法可用于融入多個(gè)視角數(shù)據(jù),打破單個(gè)視角的局限,具備較高的靈活性,可提高基因合成致死關(guān)聯(lián)預(yù)測的準(zhǔn)確率。
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)生物學(xué)領(lǐng)域,更具體地,涉及一種基因合成致死關(guān)聯(lián)預(yù)測方法。
背景技術(shù)
癌癥是由基因缺陷引起的復(fù)雜疾病。因此,揭示基因之間的相互作用關(guān)系對(duì)癌癥的診斷、治療和藥物開發(fā)至關(guān)重要。兩個(gè)基因合成致死是指兩個(gè)基因都同時(shí)失活對(duì)細(xì)胞是致命的,但其中一個(gè)基因的失活對(duì)細(xì)胞不會(huì)造成影響。因此,挖掘基因合成致死關(guān)聯(lián)有利于發(fā)現(xiàn)新的抗癌藥物靶點(diǎn),對(duì)癌癥的治療意義重大。近年來,很多研究人員利用生物實(shí)驗(yàn)手段對(duì)基因合成致死展開了研究。然而,基于生物實(shí)驗(yàn)方法的基因合成致死關(guān)聯(lián)識(shí)別仍面臨諸多挑戰(zhàn),如高成本,脫靶效應(yīng)以及平臺(tái)或細(xì)胞系之間的低一致性等。因此,需要先借助計(jì)算方法篩選出潛在的基因合成致死關(guān)聯(lián),再通過生物實(shí)驗(yàn)進(jìn)一步驗(yàn)證。
近年來,涌現(xiàn)了許多基于計(jì)算模型的基因合成致死關(guān)聯(lián)預(yù)測方法,根據(jù)模型的基本原理,可以大致地將現(xiàn)有的方法分為三類,即基于知識(shí)的方法、監(jiān)督機(jī)器學(xué)習(xí)方法和矩陣分解方法。雖然每種算法都有各自的特點(diǎn),它們通常只能夠利用到網(wǎng)絡(luò)中某種特定的拓?fù)浣Y(jié)構(gòu)。例如,基于知識(shí)的方法利用已有的合成致死基因的知識(shí)或假設(shè)來預(yù)測潛在的基因合成致死關(guān)聯(lián),然而,該方法嚴(yán)重依賴于其它基因組數(shù)據(jù),并且沒有利用已知的基因合成致死關(guān)聯(lián)中隱含的信息。監(jiān)督機(jī)器學(xué)習(xí)方法利用已知的基因合成致死關(guān)聯(lián)建立分類模型,用于預(yù)測新的基因合成致死關(guān)聯(lián),但是傳統(tǒng)的監(jiān)督機(jī)器學(xué)習(xí)方法既需要正例,也需要負(fù)例,然而基因合成致死關(guān)聯(lián)數(shù)據(jù)中通常只有正例,因此,在基因合成致死關(guān)聯(lián)預(yù)測方面,該模型具有一定的局限性。矩陣分解方法將基因合成致死關(guān)聯(lián)預(yù)測問題轉(zhuǎn)化為矩陣填充問題,進(jìn)而通過矩陣分解來進(jìn)行填充,但是矩陣分解方法的性能依賴于對(duì)潛變量空間維數(shù)的假設(shè),而真實(shí)維數(shù)通常是未知的,并且很難確定。由此可見,現(xiàn)有的計(jì)算方法通常缺乏足夠的已知基因合成致死關(guān)聯(lián)數(shù)據(jù)進(jìn)行訓(xùn)練,并且難以有效利用已知合成致死基因的相關(guān)知識(shí),加上原始數(shù)據(jù)的固有噪聲,導(dǎo)致其難以取得較高的預(yù)測準(zhǔn)確率。
發(fā)明內(nèi)容
本發(fā)明為克服上述現(xiàn)有技術(shù)所述的基因合成致死關(guān)聯(lián)預(yù)測準(zhǔn)確率不夠高的缺陷,提供一種基因合成致死關(guān)聯(lián)預(yù)測方法。
所述方法包括以下步驟:
S1:確定并使用多標(biāo)簽學(xué)習(xí)損失函數(shù);
S2:對(duì)多標(biāo)簽學(xué)習(xí)損失函數(shù)設(shè)置圖正則化懲罰項(xiàng);得到圖正則化多標(biāo)簽學(xué)習(xí)模型;
S3:利用多視角信息重新構(gòu)建S2中的圖正則化多標(biāo)簽學(xué)習(xí)模型,確定自適應(yīng)加權(quán)多視角模型;
S4:對(duì)自適應(yīng)加權(quán)多視角模型進(jìn)行求解,實(shí)現(xiàn)基因合成致死關(guān)聯(lián)的預(yù)測。
本發(fā)明的目的是為了從不同來源得到的基因相似信息中提取有用的信息,并且產(chǎn)生一個(gè)更為準(zhǔn)確和可靠的基因相似矩陣,通過圖正則化項(xiàng)將學(xué)習(xí)得到的基因相似矩陣整合到基因合成致死的預(yù)測中,進(jìn)而挖掘出更為準(zhǔn)確和可靠的新的基因合成致死對(duì),該方法可用于融入多個(gè)視角數(shù)據(jù),打破單個(gè)視角的局限,具備較高的靈活性。
優(yōu)選地,S1所述損失函數(shù)為:
其中,U為預(yù)測的基因合成致死關(guān)聯(lián)矩陣,矩陣中每個(gè)元素Uij的數(shù)值表示基因gi和基因gj形成合成致死關(guān)聯(lián)的可能性,數(shù)值越大表明越可能形成致死關(guān)聯(lián);Y∈{0,1}n×n描述已知的基因合成致死關(guān)聯(lián),n為基因的數(shù)目;Tr(·)表示矩陣的跡。
優(yōu)選地,S2中圖正則化多標(biāo)簽學(xué)習(xí)模型為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳大學(xué),未經(jīng)深圳大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010511252.6/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 關(guān)聯(lián)裝置
- 數(shù)據(jù)關(guān)聯(lián)裝置和數(shù)據(jù)關(guān)聯(lián)方法
- 安全關(guān)聯(lián)
- 設(shè)備關(guān)聯(lián)
- 終端關(guān)聯(lián)裝置和終端關(guān)聯(lián)方法
- 關(guān)聯(lián)方法和關(guān)聯(lián)設(shè)備
- 關(guān)聯(lián)方法和關(guān)聯(lián)設(shè)備
- 關(guān)聯(lián)方法和關(guān)聯(lián)設(shè)備
- 關(guān)聯(lián)分析方法和關(guān)聯(lián)分析系統(tǒng)
- 報(bào)文關(guān)聯(lián)方法、報(bào)文關(guān)聯(lián)裝置及報(bào)文關(guān)聯(lián)系統(tǒng)





