[發明專利]一種應用于醫技檢查報告的智能糾錯方法在審
| 申請號: | 201711426176.3 | 申請日: | 2017-12-26 |
| 公開(公告)號: | CN108257650A | 公開(公告)日: | 2018-07-06 |
| 發明(設計)人: | 賈祿帥;王井俊;簡剛;唐武斌 | 申請(專利權)人: | 寧波市科技園區明天醫網科技有限公司 |
| 主分類號: | G16H15/00 | 分類號: | G16H15/00;G06F17/27 |
| 代理公司: | 杭州斯可睿專利事務所有限公司 33241 | 代理人: | 毛翔威 |
| 地址: | 315040 浙江省寧波市高新區創苑路80*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 糾錯 醫技檢查 詞庫 分詞 智能 應用 遞歸神經網絡 上下文語義 預處理過程 糾錯處理 糾錯過程 模型過程 模型判斷 訓練過程 語義關系 拼音 檢測 替代 | ||
1.一種應用于醫技檢查報告的智能糾錯方法,其特征在于,包括以下步驟:
步驟1、預處理過程:
1.1、將整個醫技檢查報告語料庫作為訓練樣本,采用基于字符串匹配和隱馬爾可夫模型HMM的中文分詞模型CSM對訓練樣本進行分詞,并經過去重和編號處理后,生成醫技檢查報告詞庫MERL;
步驟2、訓練過程:
2.1、采用中文分詞模型CSM對訓練樣本進行分詞,并依據醫技檢查報告詞庫MERL對訓練樣本進行數字化編碼,若樣本分詞不在醫技檢查報告詞庫MERL中,則編碼為0;
2.2、將編碼后的訓練樣本按3:1:1的比例構建訓練集、驗證集和測試集;
2.3、將構建好的訓練集、驗證集和測試集送入到遞歸神經網絡RNN-雙層長短期記憶網絡LSTM中進行訓練,獲得糾錯模型CM;
步驟3、智能糾錯過程:
3.1、經過訓練得到糾錯模型CM后,采用中文分詞模型CSM對待檢測的醫技檢查報告進行中文分詞,獲得n個分詞,并用thresh來表示糾錯閾值,用nIn來記錄糾錯過程中分詞連續出現在醫技檢查報告詞庫MERL的數目;
3.2、依次對得到的分詞進行分析糾錯,若分詞中含有標點符號,則不需要進行糾錯;
3.3、若當前第i個分詞不在醫技檢查報告詞庫MERL,則認為該分詞是錯誤的,概率值Pi=0,并根據拼音和字形給出一組可替代錯誤分詞的建議值;
3.4、若當前第i個分詞在醫技檢查報告詞庫MERL中,則將i-nIn,…,i共計nIn+1個分詞送入糾錯模型CM得到第i+1個分詞的概率值Pi+1;
若Pi+1<thresh,則將第i+1個分詞標注為錯誤,并給出由糾錯模型CM得到的一組可替代錯誤分詞的建議值,接下來去分析第i+2個分詞,并將nIn=0;
若Pi+1≥thresh,則認為第i+1個分詞是正確的,接下來根據i-nIn,…,i,i+1共計nIn+2個詞去分析第i+2個分詞,并將nIn =nIn+1;
3.5、當所有分詞都分析完成后,智能糾錯結束。
2.根據權利要求1所述的一種應用于醫技檢查報告的智能糾錯方法,其特征在于:若在智能糾錯過程中的第i個分詞在醫技檢查報告詞庫MERL中,但概率值Pi不存在,則令Pi=1。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于寧波市科技園區明天醫網科技有限公司,未經寧波市科技園區明天醫網科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711426176.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種壓力測試數據分析方法
- 下一篇:一種基于智能驅動器的用藥方法及系統





