[發(fā)明專利]一種醫(yī)療癥狀實體信息歸一化方法和系統(tǒng)在審
| 申請?zhí)枺?/td> | 202210736314.2 | 申請日: | 2022-06-27 |
| 公開(公告)號: | CN115148367A | 公開(公告)日: | 2022-10-04 |
| 發(fā)明(設(shè)計)人: | 黃友福;肖龍源;李海洲;李稀敏;李威 | 申請(專利權(quán))人: | 廈門快商通科技股份有限公司 |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70;G06F40/295;G06F40/211;G06N3/04;G06N3/08 |
| 代理公司: | 廈門市首創(chuàng)君合專利事務(wù)所有限公司 35204 | 代理人: | 連耀忠 |
| 地址: | 361000 福建省廈門市*** | 國省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 醫(yī)療 癥狀 實體 信息 歸一化 方法 系統(tǒng) | ||
1.一種醫(yī)療癥狀實體信息歸一化方法,其特征在于,包括:
根據(jù)疾病信息定義標準癥狀類別列表,所述疾病信息包括但不限于疾病特征、疾病種類以及疾病生理現(xiàn)象;
對原始數(shù)據(jù)集中的每條疾病數(shù)據(jù),利用實體識別方法識別所包含的原始癥狀,結(jié)合實體識別方法抽取出的原始癥狀和疾病數(shù)據(jù)本身文本,對疾病數(shù)據(jù)進行打標,其標簽類別為標準癥狀列表中的一類,標注完后作為模型訓練數(shù)據(jù)集;
針對訓練數(shù)據(jù)集中的每條句子信息進行embedding編碼,得到維度為[40,80]的句子矩陣X1,針對訓練數(shù)據(jù)集中的每條癥狀信息進行embedding編碼,得到維度為[40,80]的實體矩陣X2,針對訓練數(shù)據(jù)集中的每條標準癥狀類別進行embedding編碼,得到維度為[N,1]的向量Y,其中N為定義的標準癥狀類別數(shù),向量的每個維度代表一個類別,本標準癥狀類別對應(yīng)的維度值為1,另外維度值為0;
利用訓練數(shù)據(jù)中的句子矩陣X1和實體矩陣X2進行實體信息歸一化模型的訓練,得到訓練完成后的實體信息歸一化模型;
利用實體識別方法對疾病句子進行識別,提取出實體識別方法識別到的癥狀實體信息;將句子信息和癥狀實體信息進行embedding編碼,將編碼后的句子矩陣和實體矩陣輸入訓練完成后的實體信息歸一化模型,得到維度為[1,N]的向量,確定實體信息歸一化模型輸出的N維向量中值最大的元素所在的維度,得到歸一化后的對應(yīng)類別。
2.根據(jù)權(quán)利要求1所述的一種醫(yī)療癥狀實體信息歸一化方法,其特征在于,所述實體識別方法包括但不限于:HMM模型,CRF模型以及RNN模型方法。
3.根據(jù)權(quán)利要求1所述的一種醫(yī)療癥狀實體信息歸一化方法,其特征在于,所述實體信息歸一化模型包括:句子編碼模塊,實體癥狀編碼模塊,句子批量標準化模塊,實體癥狀標準化模塊,句子自注意力模塊,第一拼接模塊,第一自注意力模塊,第二拼接模塊以及全連接層。
4.根據(jù)權(quán)利要求1所述的一種醫(yī)療癥狀實體信息歸一化方法,其特征在于,所述利用訓練數(shù)據(jù)中的句子矩陣X1和實體矩陣X2進行實體信息歸一化模型的訓練,得到訓練完成后的實體信息歸一化模型,具體包括:
輸入句子矩陣X1,按0.5比例進行隨機抽取,輸入句子批量標準化模塊得到句子標準化矩陣X1a,維度為[40,80],將句子標準化矩陣X1a輸入句子自注意力模塊,得到句子向量X1b,維度為[1,80];
輸入實體矩陣X2,按0.5比例進行隨機抽取,輸入實體批量標準化模塊得到實體標準化矩陣X2a,維度為[8,80];
將句子標準化矩陣X1a和實體標準化X2a輸入第一拼接模塊進行拼接,得到標準化拼接矩陣X3,維度為[48,80];
將標準化拼接矩陣X3輸入第一自注意力模塊得到標準化注意向量X4,維度為[1,80];
將句子向量X1b和標準化注意向量X4輸入第二拼接模塊進行拼接,得到組合向量X5,維度為[1,160];
將組合向量X5輸入全連接層并用softmax進行歸一化,得到輸出向量Y’,維度為[1,N];組合向量X5輸入全連接層后得到預(yù)設(shè)維度為[1,N]的向量,將預(yù)設(shè)維度為[1,N]的向量的每個元素經(jīng)過softmax進行歸一化就得到向量Y’;向量Y’的維度為[1,N],所有元素值的和為1;softmax公式為其中z為向量Y’的元素,i取值為1,2,3...N;
計算輸出向量Y’與Y的交叉熵,逐步迭代優(yōu)化至滿足迭代條件,得到訓練完成后的實體信息歸一化模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廈門快商通科技股份有限公司,未經(jīng)廈門快商通科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210736314.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





