[發明專利]基于文本識別的問診方法、裝置、設備及存儲介質在審
| 申請號: | 202011473887.8 | 申請日: | 2020-12-15 |
| 公開(公告)號: | CN112509682A | 公開(公告)日: | 2021-03-16 |
| 發明(設計)人: | 方亮;傅航聰 | 申請(專利權)人: | 康鍵信息技術(深圳)有限公司 |
| 主分類號: | G16H40/20 | 分類號: | G16H40/20;G16H50/20;G16H20/10;G06F40/289;G06F16/903;G06F16/332 |
| 代理公司: | 深圳市沃德知識產權代理事務所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
| 地址: | 518000 廣東省深圳市前海深港合作區前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 文本 識別 問診 方法 裝置 設備 存儲 介質 | ||
1.一種基于文本識別的問診方法,其特征在于,所述方法包括:
獲取用戶輸入的問診信息,從所述問診信息中提取關鍵信息,基于所述關鍵信息為所述用戶分配科室信息;
將所述關鍵信息及所述科室信息輸入模板匹配模型中得到多個初始匹配模板,從所述多個初始匹配模板中選取出目標模板信息并反饋至所述用戶;
接收所述用戶基于所述目標模板信息反饋的初始對話信息,從所述初始對話信息中選取出目標對話信息,將所述問診信息、所述科室信息、所述目標模板信息及所述目標對話信息輸入預先訓練的問診輔助模型得到多個初始診斷結果并反饋至預設終端;
接收預設終端基于所述多個診斷結果選取的目標診斷結果,將所述目標診斷結果、所述問診信息、所述科室信息及所述目標對話信息輸入藥品推薦模型,得到藥品推薦結果,將所述目標診斷結果和藥品推薦結果反饋至所述用戶。
2.如權利要求1所述的基于文本識別的問診方法,其特征在于,所述從所述問診信息中提取關鍵信息,包括:
對所述問診信息對應的問診文本執行分詞操作,計算各分詞在所述問診文本中的詞頻,基于所述詞頻計算出各分詞的IDF值及TF值,將各分詞的IDF值與各分詞對應的TF值相乘得到各分詞的TF-IDF值,基于各分詞的TF-IDF值選取第一預設數量的預設詞性的關鍵詞。
3.如權利要求1所述的基于文本識別的問診方法,其特征在于,所述基于所述關鍵信息為所述用戶分配科室信息,包括:
將所述關鍵信息對應的多個關鍵詞向量化后拼接成特征序列,將所述特征序列輸入預先訓練好的科室識別模型中得到所述科室信息,其中,所述科室識別模型是基于BERT預訓練模型得到的。
4.如權利要求1所述的基于文本識別的問診方法,其特征在于,所述從所述多個初始匹配模板中選取出目標模板信息,包括:
基于各個初始匹配模板對應的匹配概率由大到小對各個初始匹配模板進行排序,選取出排序靠前的第二預設數量的模板作為候選匹配模板,基于預設選取規則從所述候選匹配模板中選取出目標模板。
5.如權利要求4所述的基于文本識別的問診方法,其特征在于,所述基于預設選取規則從所述候選匹配模板中選取出目標模板,包括:
將各個候選匹配模板分別與預先配置的正則表達式進行匹配,當候選匹配模板與任一正則表達式匹配成功時,將匹配成功的正則表達式對應的預設權重賦予該候選匹配模板,基于權重由大到小對各候選模板進行排序,選取權重最高的候選模板作為所述目標模板。
6.如權利要求1所述的基于文本識別的問診方法,其特征在于,所述從所述初始對話信息中選取出目標對話信息,包括:
將所述初始對話信息轉換成對話文本,基于TF-IDF算法提取出對話文本的關鍵詞,并選取出第三預設數量的關鍵詞作為目標關鍵詞;
將所述對話文本拆分為多個句子,分別判斷每個句子中是否存在第四預設數量的目標關鍵詞,當判斷任一句子中存在第四預設數量的目標關鍵詞時,將該句子作為目標對話信息中的句子。
7.如權利要求6所述的基于文本識別的問診方法,其特征在于,所述將該句子作為目標對話信息中的句子之后,所述方法還包括:
判斷目標對話信息中是否存在句子序列長度超過預設長度的句子,若存在,對該句子執行截斷操作。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于康鍵信息技術(深圳)有限公司,未經康鍵信息技術(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011473887.8/1.html,轉載請聲明來源鉆瓜專利網。





