[發(fā)明專利]一種基于節(jié)點相似度的Kmeans中藥材功效聚類方法在審
| 申請?zhí)枺?/td> | 202010140751.9 | 申請日: | 2020-03-03 |
| 公開(公告)號: | CN111370140A | 公開(公告)日: | 2020-07-03 |
| 發(fā)明(設(shè)計)人: | 譚露露;周銀座;吳晨程 | 申請(專利權(quán))人: | 杭州師范大學(xué) |
| 主分類號: | G16H70/40 | 分類號: | G16H70/40;G16H50/70;G06K9/62 |
| 代理公司: | 杭州君度專利代理事務(wù)所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
| 地址: | 311121 浙江省杭*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 節(jié)點 相似 kmeans 中藥材 功效 方法 | ||
本發(fā)明公開了一種基于節(jié)點相似度的Kmeans中藥材功效聚類方法。本發(fā)明步驟:采集相關(guān)中醫(yī)藥數(shù)據(jù),數(shù)據(jù)處理后形成方劑組成庫、藥材功效庫、藥材性味歸經(jīng)二值表;根據(jù)23大類功效表,將中藥材功效總結(jié)歸類,構(gòu)建藥材功效矩陣;基于方劑組成庫構(gòu)建方劑?藥材二分網(wǎng)絡(luò);計算基于度分布的藥材對期望值,將藥材對期望值作為中藥材相似度;建立基于中藥材相似度的Kmeans聚類模型;基于所述聚類模型對中藥材進行聚類,得到中藥材可能具有的潛在功效。本發(fā)明利用一種藥材相似度矩陣進行Kmeans聚類的準(zhǔn)確度可達0.728。同時使用Kmeans對傳統(tǒng)藥材的性味歸經(jīng)數(shù)據(jù)聚類,得到最終結(jié)果為0.646,高出約0.08,可見本發(fā)明提出的方法使得聚類結(jié)果更加精準(zhǔn)。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機輔助藥物設(shè)計領(lǐng)域,特別涉及一種基于節(jié)點相似度的Kmeans中藥材功效聚類方法。
背景技術(shù)
本發(fā)明中針對方劑、藥材信息將功效相似或相同的藥材聚為一類。該聚類問題是一個典型的基于劃分的問題,基于劃分的聚類算法中較為簡單且常用的算法為Kmeans聚類算法。Kmeans是無監(jiān)督學(xué)習(xí)算法,是一種分組觀察的方法,可調(diào)參數(shù)少,聚類速度快,方法簡單。但傳統(tǒng)的Kmeans算法具有兩個明顯的缺點:一是聚類個數(shù)K值很難把控,如中藥材功效繁多,每種藥材可能具有幾十甚至上百種功效,這樣聚類質(zhì)量會很難保證;二是樣本間距離計算并不能確保是其真實的相似程度,特別是針對中藥這種特殊數(shù)據(jù)。
因此,本發(fā)明針對Kmeans上述兩個缺點,利用方劑組成構(gòu)建的二分網(wǎng)絡(luò),基于中藥材相關(guān)特性提出了一種基于度分布的藥材對相似度計算方法,并對比23大類功效表將藥材的散亂功效歸類,以獲得聚類個數(shù)k以及結(jié)果對照。
發(fā)明內(nèi)容
本發(fā)明的目的是針對現(xiàn)有技術(shù)的不足,提供一種基于節(jié)點相似度的Kmeans中藥材功效聚類方法。
本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案包括如下步驟:
步驟1、采集相關(guān)中醫(yī)藥數(shù)據(jù),數(shù)據(jù)處理后形成方劑組成庫、藥材功效庫、藥材性味歸經(jīng)二值表;
步驟2、根據(jù)23大類功效表,將中藥材功效總結(jié)歸類,構(gòu)建藥材功效矩陣;
步驟3、基于方劑組成庫構(gòu)建方劑-藥材二分網(wǎng)絡(luò);
步驟4、計算基于度分布的藥材對期望值,將藥材對期望值作為中藥材相似度;
步驟5、建立基于中藥材相似度的Kmeans聚類模型;
步驟6、基于所述聚類模型對中藥材進行聚類,得到中藥材可能具有的潛在功效。
所述步驟1是通過文獻、數(shù)據(jù)庫和其他網(wǎng)絡(luò)資源的途徑,基于人工、網(wǎng)絡(luò)爬蟲的方法采集中醫(yī)藥相關(guān)數(shù)據(jù),整合形成方劑組成庫、藥材功效庫以及藥材性味歸經(jīng)二值表;方劑組成庫中包括了方劑名以及對應(yīng)的藥材組成信息;藥材功效庫包含藥材所具有的各類功效;藥材性味歸經(jīng)二值表是基于藥材所具有的性味歸經(jīng)的數(shù)據(jù)構(gòu)建的二值表。所述步驟2中的23大類功效表由醫(yī)學(xué)專業(yè)人員提供,通過對采集到的藥材功效庫進行匹配,得到藥材大類功效矩陣。
所述步驟3基于方劑與藥材之間的關(guān)系構(gòu)建了方劑藥材關(guān)聯(lián)二分網(wǎng)絡(luò),其中包括22570種方劑,1249味藥材。
所述步驟4通過對網(wǎng)絡(luò)的分析提出的一種基于度分布的藥材對期望值計算方法,定義為藥材對期望值:即藥材m1和藥材m2同時存在于方劑i中的期望值,記為Pi。
Pi=A·B
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州師范大學(xué),未經(jīng)杭州師范大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010140751.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 節(jié)點查詢方法、節(jié)點、移動通訊系統(tǒng)和計算機程序產(chǎn)品
- 一種根據(jù)節(jié)點集合構(gòu)造節(jié)點關(guān)系樹的方法、裝置及系統(tǒng)
- 一種DHT網(wǎng)絡(luò)負載均衡裝置及虛節(jié)點劃分的方法
- 一種無線傳感網(wǎng)地理位置路由空洞處理方法
- 節(jié)點鎖定部件、節(jié)點滑軌、節(jié)點和機箱
- 一種待推薦節(jié)點線路的確定方法及裝置
- 流控方法、目標(biāo)節(jié)點、節(jié)點及施主節(jié)點
- 節(jié)點布局確定方法以及裝置
- 一種具有分布式柔度的全柔順微位移放大機構(gòu)
- 節(jié)點掛載方法、裝置、網(wǎng)絡(luò)節(jié)點及存儲介質(zhì)
- 一種基于kmeans算法的非法運營車輛的識別方法
- 一種基于雙重Kmeans聚類的紅外目標(biāo)輪廓分割方法
- 一種損耗相似性饋線分類方法
- 基于移動應(yīng)用使用行為的用戶分群聚類方法
- 一種網(wǎng)絡(luò)入侵檢測方法及系統(tǒng)
- 一種基于Canopy+Kmeans聚類的路網(wǎng)子區(qū)劃分及其評估方法
- 一種基于混沌理論與GA-Kmeans的OLTC觸頭類故障在線診斷方法
- 基于kmeans的攻擊行為監(jiān)測方法及裝置
- 一種基于Kmeans算法的神經(jīng)網(wǎng)絡(luò)卷積計算加速方法
- 一種基于改進Kmeans算法的視頻用戶分組方法和裝置





