[發(fā)明專(zhuān)利]一種基于節(jié)點(diǎn)相似度的Kmeans中藥材功效聚類(lèi)方法在審
| 申請(qǐng)?zhí)枺?/td> | 202010140751.9 | 申請(qǐng)日: | 2020-03-03 |
| 公開(kāi)(公告)號(hào): | CN111370140A | 公開(kāi)(公告)日: | 2020-07-03 |
| 發(fā)明(設(shè)計(jì))人: | 譚露露;周銀座;吳晨程 | 申請(qǐng)(專(zhuān)利權(quán))人: | 杭州師范大學(xué) |
| 主分類(lèi)號(hào): | G16H70/40 | 分類(lèi)號(hào): | G16H70/40;G16H50/70;G06K9/62 |
| 代理公司: | 杭州君度專(zhuān)利代理事務(wù)所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
| 地址: | 311121 浙江省杭*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 節(jié)點(diǎn) 相似 kmeans 中藥材 功效 方法 | ||
1.一種基于節(jié)點(diǎn)相似度的Kmeans中藥材功效聚類(lèi)方法,其特征在于包括以下步驟:
步驟1、采集相關(guān)中醫(yī)藥數(shù)據(jù),數(shù)據(jù)處理后形成方劑組成庫(kù)、藥材功效庫(kù)、藥材性味歸經(jīng)二值表;
步驟2、根據(jù)23大類(lèi)功效表,將中藥材功效總結(jié)歸類(lèi),構(gòu)建藥材功效矩陣;
步驟3、基于方劑組成庫(kù)構(gòu)建方劑-藥材二分網(wǎng)絡(luò);
步驟4、計(jì)算基于度分布的藥材對(duì)期望值,將藥材對(duì)期望值作為中藥材相似度;
步驟5、建立基于中藥材相似度的Kmeans聚類(lèi)模型;
步驟6、基于所述聚類(lèi)模型對(duì)中藥材進(jìn)行聚類(lèi),得到中藥材可能具有的潛在功效。
2.根據(jù)權(quán)利要求1所述的一種基于相似度的Kmeans中藥材功效聚類(lèi)方法,其特征在于步驟1具體實(shí)現(xiàn)如下:
通過(guò)文獻(xiàn)、數(shù)據(jù)庫(kù)和其他網(wǎng)絡(luò)資源的途徑,基于人工、網(wǎng)絡(luò)爬蟲(chóng)的方法采集中醫(yī)藥相關(guān)數(shù)據(jù),整合形成方劑組成庫(kù)、藥材功效庫(kù)以及藥材性味歸經(jīng)二值表;方劑組成庫(kù)中包括了方劑名以及對(duì)應(yīng)的藥材組成信息;藥材功效庫(kù)包含藥材所具有的各類(lèi)功效;藥材性味歸經(jīng)二值表是基于藥材所具有的性味歸經(jīng)的數(shù)據(jù)構(gòu)建的二值表。
3.根據(jù)權(quán)利要求1或2所述的一種基于相似度的Kmeans中藥材功效聚類(lèi)方法,其特征在于步驟2具體實(shí)現(xiàn)如下:
依照中藥的功效大類(lèi)表將功效歸類(lèi)成23類(lèi),分別是補(bǔ)氣、安神、開(kāi)竅、化濕、溫胃止嘔、涌吐藥、補(bǔ)血、祛風(fēng)除濕、平肝息風(fēng)、利尿通淋、溫里理氣、拔毒生肌、活血化瘀、消食、殺蟲(chóng)解毒、止痛、發(fā)散風(fēng)寒、斂肺澀腸、收斂止血清熱解毒、瀉下、清熱瀉火、化痰止咳平喘、發(fā)散風(fēng)熱;通過(guò)對(duì)采集到的藥材功效庫(kù)進(jìn)行匹配,得到簡(jiǎn)化的藥材功效矩陣。
4.根據(jù)權(quán)利要求3所述的一種基于相似度的Kmeans中藥材功效聚類(lèi)方法,其特征在于步驟3具體實(shí)現(xiàn)如下:
使用方劑組成庫(kù),構(gòu)建方劑藥材關(guān)聯(lián)二分網(wǎng)絡(luò),其中包括22570種方劑,1249味藥材。
5.根據(jù)權(quán)利要求4所述的一種基于相似度的Kmeans中藥材功效聚類(lèi)方法,其特征在于步驟4具體實(shí)現(xiàn)如下
定義藥材對(duì)期望值:即藥材m1和藥材m2同時(shí)存在于方劑i中的期望值,記為Pi;
Pi=A·B
其中,Pi為藥材m1和藥材m2同時(shí)存在于方劑i中的期望值;A為方劑i被藥材m1選中的概率,B為方劑i被藥材m2選中的概率,Di為方劑i的度,為藥材m1的度,為藥材m2的度,D為所有方劑度之和;將兩個(gè)藥材同時(shí)存在于每個(gè)方劑中的概率值Pi累加,共n個(gè)方劑,得到這兩個(gè)藥材同時(shí)出現(xiàn)于某一方劑中的期望值W;藥材m1與藥材m2實(shí)際共同存在于Wreal個(gè)方劑中,可由以下公式計(jì)算得到的值作為藥材的相似度值:
的取值范圍為(-1,-0.5)和(1,101);再將三元組變換為矩陣形式作為中藥材相似度矩陣。
6.根據(jù)權(quán)利要求5所述的一種基于相似度的Kmeans中藥材功效聚類(lèi)方法,其特征在于步驟5具體實(shí)現(xiàn)如下
5-1.對(duì)中藥材相似度矩陣使用主成分分析法進(jìn)行降維,降維后數(shù)據(jù)維度為1249*2;
5-2.為了匹配功效大類(lèi)個(gè)數(shù),令聚類(lèi)個(gè)數(shù)k=23;
5-3.計(jì)算初始聚類(lèi)中心,隨機(jī)選取23個(gè)樣本為初始樣本;
5-4.根據(jù)最小距離原則,為樣本分配最鄰近聚類(lèi);即計(jì)算當(dāng)前類(lèi)內(nèi)任意樣本的類(lèi)內(nèi)質(zhì)心距離,比較得到質(zhì)心距離最小的樣本,則歸為當(dāng)前類(lèi),并計(jì)算平均誤差;
5-5.更新聚類(lèi)中心;即計(jì)算每一類(lèi)中所有點(diǎn)的平均誤差,然后再次進(jìn)行分配,再次計(jì)算平均誤差;
5-6.比較前后兩次的平均誤差是否相等,若不相等則返回步驟5-5重新更新聚類(lèi)中心,若相等則進(jìn)入步驟5-7;
5-7.以此類(lèi)推,最終得到每個(gè)類(lèi)別的樣本;更新并保存類(lèi)別和質(zhì)心距離。
7.根據(jù)權(quán)利要求6所述的一種基于相似度的Kmeans中藥材功效聚類(lèi)方法,其特征在于步驟6具體實(shí)現(xiàn)如下
將得到的聚類(lèi)結(jié)果與已有的藥材功效庫(kù)進(jìn)行對(duì)比分析,以驗(yàn)證方法的準(zhǔn)確度;衡量指標(biāo)使用Pearson相關(guān)系數(shù);具體步驟為:
6-1.使用Pearson相關(guān)系數(shù)計(jì)算得到類(lèi)別Ki中每一味藥材與其他藥材的功效相關(guān)性,并計(jì)算平均值作為此藥材的平均相關(guān)性;
6-2.得到類(lèi)別Ki中所有藥材的平均相關(guān)性列表,并將列表均值作為衡量類(lèi)別Ki的歸類(lèi)準(zhǔn)確度指標(biāo)。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于杭州師范大學(xué),未經(jīng)杭州師范大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010140751.9/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 節(jié)點(diǎn)查詢(xún)方法、節(jié)點(diǎn)、移動(dòng)通訊系統(tǒng)和計(jì)算機(jī)程序產(chǎn)品
- 一種根據(jù)節(jié)點(diǎn)集合構(gòu)造節(jié)點(diǎn)關(guān)系樹(shù)的方法、裝置及系統(tǒng)
- 一種DHT網(wǎng)絡(luò)負(fù)載均衡裝置及虛節(jié)點(diǎn)劃分的方法
- 一種無(wú)線傳感網(wǎng)地理位置路由空洞處理方法
- 節(jié)點(diǎn)鎖定部件、節(jié)點(diǎn)滑軌、節(jié)點(diǎn)和機(jī)箱
- 一種待推薦節(jié)點(diǎn)線路的確定方法及裝置
- 流控方法、目標(biāo)節(jié)點(diǎn)、節(jié)點(diǎn)及施主節(jié)點(diǎn)
- 節(jié)點(diǎn)布局確定方法以及裝置
- 一種具有分布式柔度的全柔順微位移放大機(jī)構(gòu)
- 節(jié)點(diǎn)掛載方法、裝置、網(wǎng)絡(luò)節(jié)點(diǎn)及存儲(chǔ)介質(zhì)
- 相似圖像提取裝置、相似圖像提取方法以及相似圖像提取程序
- 一種鋼結(jié)構(gòu)火災(zāi)反應(yīng)分析方法
- 相似度計(jì)算裝置、相似度計(jì)算方法以及相似度計(jì)算程序
- 一種蛋白質(zhì)相似度及相似蛋白質(zhì)的確定方法和系統(tǒng)
- 一種獲取相似語(yǔ)句的方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種圖像搜索方法、裝置和存儲(chǔ)介質(zhì)
- 基于相似壽命模型和相似壽命的復(fù)雜產(chǎn)品可靠性評(píng)定方法
- 獲取機(jī)構(gòu)技術(shù)相似性的方法及裝置
- 口罩(相似)
- 臺(tái)燈(相似)
- 一種基于kmeans算法的非法運(yùn)營(yíng)車(chē)輛的識(shí)別方法
- 一種基于雙重Kmeans聚類(lèi)的紅外目標(biāo)輪廓分割方法
- 一種損耗相似性饋線分類(lèi)方法
- 基于移動(dòng)應(yīng)用使用行為的用戶(hù)分群聚類(lèi)方法
- 一種網(wǎng)絡(luò)入侵檢測(cè)方法及系統(tǒng)
- 一種基于Canopy+Kmeans聚類(lèi)的路網(wǎng)子區(qū)劃分及其評(píng)估方法
- 一種基于混沌理論與GA-Kmeans的OLTC觸頭類(lèi)故障在線診斷方法
- 基于kmeans的攻擊行為監(jiān)測(cè)方法及裝置
- 一種基于Kmeans算法的神經(jīng)網(wǎng)絡(luò)卷積計(jì)算加速方法
- 一種基于改進(jìn)Kmeans算法的視頻用戶(hù)分組方法和裝置





