[發明專利]文本信息處理方法、裝置、電子設備和存儲介質在審
| 申請號: | 202110736093.4 | 申請日: | 2021-06-30 |
| 公開(公告)號: | CN113590777A | 公開(公告)日: | 2021-11-02 |
| 發明(設計)人: | 袁泉;陳俊;黃海峰;代小亞 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35;G06F40/279;G16H50/20 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 張夢瑤 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 信息處理 方法 裝置 電子設備 存儲 介質 | ||
1.一種文本信息處理方法,包括:
根據待處理病歷中的文本信息生成對應的病歷導出圖;
對所述病歷導出圖中的疾病節點進行聚類,根據聚類結果將所述病歷導出圖劃分為多個病歷子圖;
對所述多個病歷子圖分別進行編碼,根據編碼得到的實體特征生成疾病診斷結果。
2.根據權利要求1所述的文本信息處理方法,還包括:
根據所述文本信息生成對應的自由文本特征;
其中,所述根據編碼得到的實體特征生成疾病診斷結果,包括:
根據所述自由文本特征和所述實體特征生成所述疾病診斷結果。
3.根據權利要求1所述的文本信息處理方法,其中,所述根據待處理病歷中的文本信息生成對應的病歷導出圖,包括:
獲取預先構建的醫療知識圖,所述醫療知識圖中包括病況實體節點、疾病節點以及病況實體和疾病之間的因果關系分數;
獲取所述文本信息中的病況實體;
將所述醫療知識圖中,與所述文本信息中的病況實體之間的所述因果關系分數大于預設的分數閾值的疾病節點和所述病況實體節點,確定為所述病歷導出圖中的節點;以及
根據所述病歷導出圖中的節點生成所述病歷導出圖。
4.根據權利要求3所述的文本信息處理方法,還包括:
根據歷史病歷中的病況實體和對應的疾病構建所述醫療知識圖。
5.根據權利要求1所述的文本信息處理方法,其中,所述對所述病歷導出圖中的疾病節點進行聚類,包括:
采用標簽傳播算法對所述病歷導出圖中的疾病節點進行聚類。
6.根據權利要求1所述的文本信息處理方法,其中,所述對所述多個病歷子圖分別進行編碼,根據編碼得到的實體特征生成疾病診斷結果,包括:
對所述病歷子圖進行圖卷積編碼得到子圖編碼;
根據所述子圖編碼計算所述病歷子圖對應的子圖內注意力分數;
根據所述子圖內注意力分數生成所述病歷子圖對應的子圖表示結果;
根據所述多個病歷子圖對應的多個所述子圖表示結果計算子圖間注意力分數;以及
根據多個所述子圖表示結果和所述子圖間注意力分數生成所述實體特征,根據所述實體特征生成所述疾病診斷結果。
7.根據權利要求6所述的文本信息處理方法,其中,所述對所述病歷子圖進行圖卷積編碼得到子圖編碼,包括:
獲取所述病歷子圖中的節點的向量表示,以及對應的單位矩陣、鄰接矩陣和度矩陣;
根據所述病歷子圖中的節點的向量表示、所述單位矩陣、所述鄰接矩陣和所述度矩陣,生成所述子圖編碼。
8.一種文本信息處理裝置,包括:
第一生成模塊,用于根據待處理病歷中的文本信息生成對應的病歷導出圖;
聚類模塊,用于對所述病歷導出圖中的疾病節點進行聚類,根據聚類結果將所述病歷導出圖劃分為多個病歷子圖;
第二生成模塊,用于對所述多個病歷子圖分別進行編碼,根據編碼得到的實體特征生成疾病診斷結果。
9.根據權利要求8所述的文本信息處理裝置,還包括:
第三生成模塊,用于根據所述文本信息生成對應的自由文本特征;
其中,所述第二生成模塊包括:
第一生成單元,用于根據所述自由文本特征和所述實體特征生成所述疾病診斷結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110736093.4/1.html,轉載請聲明來源鉆瓜專利網。





