[發(fā)明專利]一種基于生物數(shù)據(jù)的數(shù)據(jù)分析方法有效
| 申請?zhí)枺?/td> | 201811360788.1 | 申請日: | 2018-11-15 |
| 公開(公告)號: | CN109597901B | 公開(公告)日: | 2021-11-16 |
| 發(fā)明(設(shè)計(jì))人: | 黃海輝;戴經(jīng)國;梁勇;陳燕琴 | 申請(專利權(quán))人: | 韶關(guān)學(xué)院 |
| 主分類號: | G06F16/45 | 分類號: | G06F16/45;G06K9/62 |
| 代理公司: | 廣州三環(huán)專利商標(biāo)代理有限公司 44202 | 代理人: | 顏希文;麥小嬋 |
| 地址: | 512005 *** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 生物 數(shù)據(jù) 分析 方法 | ||
1.一種基于生物數(shù)據(jù)的數(shù)據(jù)分析方法,其特征在于,包括:
建立數(shù)據(jù)格式池,將生物數(shù)據(jù)通過所述格式池進(jìn)行過濾,剔除錯(cuò)誤格式的生物數(shù)據(jù);
獲取生物數(shù)據(jù),建立樣本數(shù)據(jù)庫;
對所述樣本數(shù)據(jù)庫中的生物數(shù)據(jù)進(jìn)行特征提取處理,形成屬性不同的若干個(gè)聚類,建立聚類庫;
提取所述聚類庫中的數(shù)據(jù)建立高維模型;
將需要進(jìn)行實(shí)驗(yàn)的生物數(shù)據(jù)通過高維模型進(jìn)行過濾,獲得可行數(shù)據(jù);
所述對所述樣本數(shù)據(jù)庫中的生物數(shù)據(jù)進(jìn)行特征提取處理,形成屬性不同的若干個(gè)聚類,建立聚類庫,包括:
提取所述樣本數(shù)據(jù)庫中的生物數(shù)據(jù),使用統(tǒng)計(jì)方法將各個(gè)生物數(shù)據(jù)進(jìn)行分析提取概念關(guān)鍵詞;
利用層次聚類算法計(jì)算所述概念詞之間的相似度,使之聚成一類,形成具有等級關(guān)系的聚類;
建立聚類庫,將形成的所有聚類儲存在聚類庫中。
2.如權(quán)利要求1所述的方法,其特征在于,所述統(tǒng)計(jì)方法包括:串頻統(tǒng)計(jì)方法和信息熵統(tǒng)計(jì)方法。
3.如權(quán)利要求1所述的方法,其特征在于,所述利用層次聚類算法計(jì)算所述概念詞之間的相似度,使之聚成一類,形成具有等級關(guān)系的聚類,包括:
將提取出來的每一個(gè)概念關(guān)鍵詞單獨(dú)列成一個(gè)類;
利用相似度算法計(jì)算類與類之間的相似度;
將計(jì)算出相似度大的類合并成一個(gè)聚類,直到所有單獨(dú)列成的類完成合并;
對已經(jīng)完成合并的聚類繼續(xù)執(zhí)行上述步驟,繼續(xù)進(jìn)行聚類間合并,直至形成一個(gè)具有等級關(guān)系的聚類。
4.如權(quán)利要求3所述的方法,其特征在于,所述相似度算法包括Dice系數(shù)和皮爾遜相關(guān)性公式。
5.如權(quán)利要求1所述的方法,其特征在于,所述提取所述聚類庫中的數(shù)據(jù)建立高維模型,包括:
建立訓(xùn)練數(shù)據(jù)庫和測試數(shù)據(jù)庫,將聚類庫中的數(shù)據(jù)分別儲存到所述訓(xùn)練數(shù)據(jù)庫和所述測試數(shù)據(jù)庫;
建立高維模型,將所述訓(xùn)練數(shù)據(jù)庫中數(shù)據(jù)傳輸?shù)礁呔S模型中進(jìn)行訓(xùn)練;
數(shù)據(jù)訓(xùn)練完成后,將所述測試數(shù)據(jù)庫中數(shù)據(jù)傳輸?shù)礁呔S模型中進(jìn)行測試,獲得經(jīng)過優(yōu)化處理后的高維模型。
6.如權(quán)利要求5所述的方法,其特征在于,所述將所述訓(xùn)練數(shù)據(jù)庫中數(shù)據(jù)傳輸?shù)礁呔S模型中進(jìn)行訓(xùn)練,還包括:當(dāng)訓(xùn)練的次數(shù)達(dá)到訓(xùn)練閾值或訓(xùn)練的準(zhǔn)確度達(dá)到預(yù)設(shè)的訓(xùn)練準(zhǔn)確值后,停止訓(xùn)練;所述將所述測試數(shù)據(jù)庫中數(shù)據(jù)傳輸?shù)礁呔S模型中進(jìn)行測試,還包括:當(dāng)測試的次數(shù)達(dá)到測試閾值或測試的準(zhǔn)確度達(dá)到預(yù)設(shè)的測試準(zhǔn)確值后,停止測試。
7.如權(quán)利要求6所述的方法,其特征在于,所述訓(xùn)練閾值為20萬次,所述訓(xùn)練準(zhǔn)確值為90%;所述測試閾值為20萬次,所述測試準(zhǔn)確值為90%。
8.如權(quán)利要求1所述的方法,其特征在于,所述數(shù)據(jù)格式池包括數(shù)字格式、圖片格式、字符格式和算法字符。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于韶關(guān)學(xué)院,未經(jīng)韶關(guān)學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811360788.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





