[發明專利]一種基于BERT和融入功效信息的中藥處方生成方法有效
| 申請號: | 202010054040.X | 申請日: | 2020-01-17 |
| 公開(公告)號: | CN111312356B | 公開(公告)日: | 2022-07-01 |
| 發明(設計)人: | 呂建成;李嬋娟;桑永勝;蒲翊凡;孫亞楠 | 申請(專利權)人: | 四川大學 |
| 主分類號: | G16H20/10 | 分類號: | G16H20/10;G16H50/50 |
| 代理公司: | 北京正華智誠專利代理事務所(普通合伙) 11870 | 代理人: | 代維凡 |
| 地址: | 610064 四*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 bert 融入 功效 信息 中藥 處方 生成 方法 | ||
本發明提供了一種基于BERT和融入功效信息的中藥處方生成方法,獲取癥狀描述和處方數據對,以及中藥功效信息集;并通過預訓練好的BERT模型得到固定長度的每個中藥的功效信息編碼;構建基于BERT?GRU的中藥處方生成模型,并利用所述訓練集微調所述中藥處方生成模型;利用中藥處方生成模型生成處方。本發明通過深度學習的方法,利用預訓練的BERT強大的語言表征能力來提升句子表達能力,從中醫古籍經典方劑數據中挖掘規律,并融入中藥功效信息,通過訓練編碼器和解碼器兩個網絡,來最大化中藥處方序列的條件概率,實現根據癥狀文本描述開具輔助的中醫處方。
技術領域
本發明屬于醫藥技術領域,尤其涉及一種基于BERT和融入功效信息的中藥處方生成方法。
背景技術
我國在中醫藥學方面的研究具有悠久歷史和深厚底蘊,至今已有數千年的歷史。中醫藥結合東方傳統哲學和古代科技文化的精髓,在診斷、治療、預防、保健等方面積累、總結、傳承了大量經驗,形成了自上而下的一套完整的理論診治體系?,F在的許多中醫經常在治療患者時以過去傳承下來的經典處方和治療記錄作為參考。
當前,計算機技術日益成熟,滲透到了各個行業。隨著人工智能與大數據技術的進一步發展,互聯網技術可以為我國中醫行業注入新的活力,提高其效率。方劑學在中醫藥研究中一直是研究的熱門方向,處方是中醫診治中非常重要的一環,完整的處方包括草藥成分、比例、制備方法和湯劑劑量,而草藥組成是最重要的部分。由于中醫處方的組成成分、作用機制非常復雜,同時本身理論存在模糊的地方,“方-癥-藥”關系規整化具有較大的難度,這激勵我們設計一種能夠通過學習過去中醫藥幾千年來積累、總結下來的經典方劑來根據癥狀生成處方的模型,從中醫經典方劑中挖掘出暗藏的、潛在的“方-藥-癥”規律,根據癥狀智能地生成處方,促進中醫更好的治療患者。
大量古籍資料中含有的診治方法和處方等文本數據,通過自然語言處理能夠幫助我們將隱藏在文字中的規律挖掘出來,而深度學習是自然語言處理的強大工具。如圖1所示,現有的處方生成方法主要由深度學習中的seq2seq網絡結構組成,seq2seq模型包括編碼器和解碼器,編碼器對癥狀句子進行編碼,解碼器對其進行解碼生成處方。編碼器和解碼器模型一般采用RNN或其變體GRU等,層數較淺,較為簡單,存在很大的不足,不能很好的對癥狀數據進行編碼;且單純研究癥狀與處方之間的對應關系,沒有引入中藥功效、主治等外部知識信息,準確率、召回率、F1值較低。
發明內容
針對現有技術中的上述不足,本發明提供的一種基于BERT和融入功效信息的中藥處方生成方法,通過深度學習的方法,利用預訓練的BERT模型強大的語言表征能力來提升句子表達能力,從中醫古籍經典方劑數據中挖掘規律,并融入中藥功效信息,實現根據癥狀文本描述開具輔助的中醫處方。
為了達到以上目的,本發明采用的技術方案為:
本方案提供一種基于BERT和融入功效信息的中藥處方生成方法,包括以下步驟:
S1、獲取若干一一對應的癥狀描述和處方數據對,以及中藥功效信息,并對所述數據對進行預處理,將預處理后的結果作為訓練集;
S2、將所述中藥功效信息按中藥字典順序進行排序,并通過預訓練好的BERT模型得到固定長度的每個中藥的功效信息編碼;
S3、將預訓練好的BERT模型作為編碼器,將GRU作為解碼器,利用所述中藥功效信息的編碼初始化GRU解碼器的輸出層參數,并利用所述訓練集微調BERT編碼器,同時利用所述訓練集訓練GRU解碼器,構建中藥處方生成模型;
S4、將待預測的癥狀句子作為測試樣本輸入至訓練好的中藥處方生成模型,并利用中藥處方生成模型生成中藥的處方。
進一步地,所述步驟S1包括以下步驟:
S101、爬取網上公開的資料,得到方劑數據和中藥數據,其中,所述中藥數據包括中藥別名以及中藥功效信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川大學,未經四川大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010054040.X/2.html,轉載請聲明來源鉆瓜專利網。





