[發明專利]一種醫療問診數據處理方法和裝置在審
| 申請號: | 202110601186.6 | 申請日: | 2021-05-31 |
| 公開(公告)號: | CN113555133A | 公開(公告)日: | 2021-10-26 |
| 發明(設計)人: | 賴偉;周昌偉;陳良軍 | 申請(專利權)人: | 北京易康醫療科技有限公司 |
| 主分類號: | G16H80/00 | 分類號: | G16H80/00;G16H50/20;G16H50/70;G06F40/30;G10L15/04;G10L15/06;G10L15/26;G10L17/22 |
| 代理公司: | 北京開陽星知識產權代理有限公司 11710 | 代理人: | 王雪 |
| 地址: | 100025 北京市朝*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 醫療 問診 數據處理 方法 裝置 | ||
1.一種醫療問診數據處理方法,其特征在于,包括:
在醫療問診過程中,采集目標時長的問診語音數據;
根據語音方向信息對所述問診語音數據進行切割,獲取屬于第一語音方向的第一語音片段集合和屬于第二語音方向的第二類語音片段集合;
對所述第一語音片段集合和所述第二語音片段集合進行語音識別,生成第一文本集合和第二文本集合;
對所述第一文本集合和所述第二文本集合進行語義理解,確定所述第一語音方向對應的第一用戶身份標識,以及所述第二語音方向對應的第二用戶身份標識;
根據所述第一用戶身份標識和所述第二用戶身份標識對所述第一文本集合和所述第二文本集合進行語義分析獲取結構化數據,將所述問診語音數據和所述結構化數據存儲在預設數據庫。
2.根據權利要求1所述的醫療問診數據處理方法,其特征在于,所述對所述第一文本集合和所述第二文本集合進行語義理解,獲取確定所述第一語音方向對應的第一用戶身份標識,以及所述第二語音方向對應的第二用戶身份標識,包括:
根據所述第一文本集合中每第一文本的語義理解結果確定所述每第一文本屬于所述第一用戶身份標識的第一概率和所述第二用戶身份標識的第二概率;
根據所述第二文本集合中每第二文本的語義理解結果確定所述每第二文本屬于所述第一用戶身份標識的第三概率和所述第二用戶身份標識的第四概率;
根據多個所述第一概率確定所述第一用戶身份標識的第一總概率,并根據多個所述第二概率確定所述第二用戶身份標識的第二總概率,在所述第一總概率大于等于所述第二總概率的情況下,確定所述第一語音方向為所述第一用戶身份標識;
根據多個所述第三概率確定所述第一用戶身份標識的第三總概率,并根據多個所述第四概率確定所述第二用戶身份標識的第四總概率,在所述第三總概率小于所述第四總概率的情況下,確定所述第二語音方向為所述第二用戶身份標識。
3.根據權利要求1所述的醫療問診數據處理方法,其特征在于,所述對所述第一語音片段集合和所述第二語音片段集合進行語音識別,生成第一文本集合和第二文本集合,包括:
對所述第一語音片段集合中的每第一語音片段和所述第二語音片段集合中的每第二語音片段進行特征提取,獲取多個第一聲學特征和多個第二聲學特征;
通過預訓練的聲學模型和語言模型分別對所述多個第一聲學特征和所述多個第二聲學特征進行解碼搜索,獲取所述第一文本集合和所述第二文本集合。
4.根據權利要求3所述的醫療問診數據處理方法,其特征在于,
獲取已標注的語音數據樣本,將所述語音數據樣本輸入神經網絡進行訓練,獲取基礎模型;
通過已標注的醫療問診語音數據,將所述醫療問診語音數據輸入所述基礎模型進行訓練,對所述基礎模型的模型參數進行調整,獲取所述聲學模型。
5.根據權利要求3所述的醫療問診數據處理方法,其特征在于,
獲取醫療領域的專業文本數據,將所述專業文本數據與通用文本數據按照預設權重混合,訓練所述語言模型。
6.根據權利要求1所述的醫療問診數據處理方法,其特征在于,所述根據所述第一用戶身份標識和所述第二用戶身份標識對所述第一文本集合和所述第二文本集合進行語義分析獲取結構化數據,將所述問診語音數據和所述結構化數據存儲在預設數據庫,包括:
根據所述第一文本集合和所述第二文本集合確定多組問答文本,通過預訓練的分類器對所述多組問答文本進行分類,獲取每一組問答文本對應的問答類型;
根據問答類型確定目標文本,通過預訓練的信息提取模型對所述目標文本進行信息提取,獲取多個關鍵詞;
根據預設的詞典和映射模型對所述多個關鍵詞進行數據規范化處理,獲取目標詞語;
根據所述目標詞語生成所述結構化數據,將所述問診語音數據和所述結構化數據存儲在預設數據庫。
7.根據權利要求1所述的醫療問診數據處理方法,其特征在于,還包括:
將所述結構化數據發送到終端顯示;
接收到對所述結構化數據的確認信息或更新信息,獲取問診語音數據、確認或更新文本信息訓練聲學模型和語言模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京易康醫療科技有限公司,未經北京易康醫療科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110601186.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種智能電表的固件升級方法及智能電表
- 下一篇:一種智能駕駛的交互系統及車輛





