[發明專利]身體病況文本的分類方法、裝置及設備有效
| 申請號: | 201910675905.1 | 申請日: | 2019-07-25 |
| 公開(公告)號: | CN110427486B | 公開(公告)日: | 2022-03-01 |
| 發明(設計)人: | 陳俊 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/242;G06F40/289;G06N3/08;G16H50/20 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 朱穎;劉芳 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 身體 病況 文本 分類 方法 裝置 設備 | ||
1.一種身體病況文本的分類方法,其特征在于,包括:
獲取身體病況文本,所述身體病況文本用于描述癥狀信息;
對所述身體病況文本進行分詞處理,得到分詞結果,所述分詞結果包括多個中文詞和多個醫療實體詞;
所述中文詞為對身體病況文本進行中文分詞得到的詞匯,所述醫療實體詞為身體病況文本中的醫學專用詞匯,多個中文詞和多個醫療實體詞可以存在交集;
將所述多個中文詞和所述多個醫療實體詞輸入深度學習模型,得到所述深度學習模型的輸出結果,所述輸出結果用于指示所述身體病況文本對應的各種癥狀類型的概率分布;
根據所述輸出結果,確定所述身體病況文本對應的癥狀類型;
所述身體病況文本包括至少一個文本片段;
所述將所述多個中文詞和所述多個醫療實體詞輸入深度學習模型,得到所述深度學習模型的輸出結果,包括:
根據各所述文本片段對應的多個中文詞和符號映射表,得到各所述文本片段對應的第一符號序列,其中,所述符號映射表包括標準中文詞和根據所述標準中文詞的詞頻確定的符號;
根據所述身體病況文本對應的多個醫療實體詞和醫療實體詞典,得到所述身體病況文本對應的第二符號序列,其中,所述醫療實體詞典包括根據詞頻確定標準醫療實體詞;
將所述第一符號序列和所述第二符號序列輸入至所述深度學習模型,得到輸出結果。
2.根據權利要求1所述的方法,其特征在于,所述對所述身體病況文本進行分詞處理,得到分詞結果,包括:
對各所述文本片段進行中文分詞,得到各所述文本片段對應的多個中文詞;
對所述身體病況文本進行自然語言理解,得到所述身體病況文本對應的多個醫療實體詞。
3.根據權利要求1所述的方法,其特征在于,所述深度學習模型包括至少一個卷積層和一個全連接層,所述將所述第一符號序列和所述第二符號序列輸入至所述深度學習模型,得到輸出結果,包括:
將各所述文本片段對應的第一符號序列輸入至所述各所述卷積層,并將所述身體病況文本對應的第二符號序列輸入至所述全連接層,得到輸出結果。
4.根據權利要求1至3任一項所述的方法,其特征在于,所述將所述多個中文詞和所述多個醫療實體詞輸入深度學習模型,得到所述深度學習模型的輸出結果之前,還包括:
對訓練數據進行平衡采樣,得到多個訓練樣本,每個所述訓練樣本包括癥狀類型和一個身體病況樣本;
以各所述身體病況樣本對應的第一符號序列和第二符號序列作為深度學習模型的輸入,以所述癥狀類型為真實標簽,對所述深度學習模型進行訓練,得到訓練后的深度學習模型。
5.根據權利要求4所述的方法,其特征在于,所述以各所述身體病況樣本對應的第一符號序列和第二符號序列作為深度學習模型的輸入,以所述癥狀類型為真實標簽,對所述深度學習模型進行訓練,得到訓練后的深度學習模型,包括:
針對每個所述訓練樣本,將所述訓練樣本的身體病況樣本對應的第一符號序列輸入至深度學習模型的卷積層,將所述訓練樣本的身體病況樣本對應的第二符號序列輸入至深度學習模型的全連接層,獲取所述深度學習模型輸出的預測結果;
根據各所述訓練樣本的所述真實標簽和所述預測結果,獲取代價函數,并根據所述代價函數對所述深度學習模型的參數進行調整,直至達到訓練結束條件。
6.根據權利要求4所述的方法,其特征在于,所述訓練數據包括至少一個實例,每個實例包括癥狀類型和身體病況樣本,所述對訓練數據進行平衡采樣,得到多個訓練樣本,包括:
針對每種癥狀類型,獲取所述癥狀類型對應的實例數量,若所述實例數量小于第一閾值,則對所述癥狀類型對應的實例進行過采樣;若所述實例數量大于第二閾值,則對所述癥狀類型對應的實例進行欠采樣;若所述實例數量大于等于所述第一閾值且小于等于所述第二閾值,則對所述癥狀類型對應的實例全采樣;其中,所述第一閾值小于所述第二閾值;
將采樣后的各所述癥狀類型對應的實例作為訓練樣本。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910675905.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種文學作品分類方法和裝置
- 下一篇:一種數據標注方法、裝置及存儲介質





