[發明專利]一種用于醫療票據OCR的醫保目錄匹配方法有效
| 申請號: | 202210087319.7 | 申請日: | 2022-01-25 |
| 公開(公告)號: | CN114445842B | 公開(公告)日: | 2022-09-20 |
| 發明(設計)人: | 褚一平;陳士春;唐志學;鄭義;陳建勇;朱華山;郁星星;張雪妮;潘翔;趙小敏;鄭河榮;黃葉玨 | 申請(專利權)人: | 杭州海量信息技術有限公司 |
| 主分類號: | G06V30/418 | 分類號: | G06V30/418;G06V30/10;G06F16/901;G06F16/903;G06F40/289 |
| 代理公司: | 北京盛詢知識產權代理有限公司 11901 | 代理人: | 方亞兵 |
| 地址: | 310012 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 醫療 票據 ocr 醫保 目錄 匹配 方法 | ||
1.一種用于醫療票據OCR的醫保目錄匹配方法,其特征在于,包括,
基于醫保目錄庫中的醫保目錄構建醫保目錄庫熱力圖;
設置醫保目錄相似度度量方法,所述醫保目錄相似度度量方法包括雙目錄相似度度量方法與費用-目錄相似度度量方法;
基于所述醫保目錄庫熱力圖與所述雙目錄相似度度量方法構建醫保目錄池塘結構庫;
基于所述費用-目錄相似度度量方法與所述醫保目錄池塘結構庫對醫療票據OCR的費用明細進行搜索,完成所述醫保目錄匹配;
構建所述醫保目錄庫熱力圖的方法為:
獲取所述醫保目錄的關鍵字字頻表;
基于所述關鍵字字頻表對醫保目錄的每個條目中的字符進行關鍵字匹配,獲取所述醫保目錄的熱力數據;
基于所述熱力數據中的元素建立所述醫保目錄庫熱力圖;
獲取所述關鍵字字頻表的方法為:
對所述醫保目錄進行去非中文字符處理,獲得純中文字符的醫保目錄,對所述純中文字符的醫保目錄的條目進行中文分詞,獲得分詞集合,對所述分詞集合去重,采用人工的方式糾正錯誤分詞,并對所述糾正后的分詞再次去重,得到醫保目錄關鍵字集合,統計所述醫保目錄中每個中文字符的出現頻率,獲得字符頻率表,基于所述字符頻率表獲取所述醫保目錄關鍵字集合中的每條關鍵字中每個字符的頻率,計算所述關鍵字的全部字符頻率均值,將所述頻率均值作為所述關鍵字的字頻,在所述關鍵字集合中加入對應的所述字頻,獲得關鍵字字頻表;
獲取所述醫保目錄的熱力數據的方法為:
建立空鏈表,基于所述關鍵字字頻表對所述醫保目錄的每個條目中的字符進行關鍵字匹配,基于匹配結果,將所述關鍵字的起止位置插入所述空鏈表中,插入所述關鍵字的起止位置后的所述空鏈表即所述醫保目錄的熱力數據;
構建所述醫保目錄池塘結構庫的方法為:
建立與所述醫保目錄相同長度的標志位數據,基于所述雙目錄相似度度量方法,獲取所述標志位數據的雙目錄相似度,基于所述標志位數據的值與所述標志位數據的雙目錄相似度獲取相似度閾值參數;
基于所述雙目錄相似度度量方法,從所述醫保目錄庫中的最后一個醫保目錄開始,逐條計算最后一個醫保目錄與其它醫保目錄兩兩之間的的雙目錄相似度,其中,將所述雙目錄相似度大于所述相似度閾值參數的醫保目錄,以及對應的所述醫保目錄庫熱力圖放入一個臨時庫,將所述臨時庫當做一個池塘,根據同樣的方法對所述醫保目錄庫中的其它醫保目錄進行處理,獲得若干池塘,將每個池塘中的最后一個醫保目錄作為該池塘的索引目錄,把各個池塘的索引目錄組在一起,建立所述醫保目錄池塘結構庫。
2.根據權利要求1所述的用于醫療票據OCR的醫保目錄匹配方法,其特征在于,所述醫保目錄匹配的方法為:
預設相似度閾值,基于所述費用-目錄相似度度量方法與所述醫保目錄池塘結構庫對醫療票據OCR的費用明細進行搜索,獲取所述醫療票據OCR的費用明細的費用-目錄相似度,基于所述預設相似度閾值與所述費用-目錄相似度完成所述醫保目錄池塘結構庫的搜索,對搜索結果進行匯總,完成醫保目錄匹配。
3.根據權利要求1所述的用于醫療票據OCR的醫保目錄匹配方法,其特征在于,所述雙目錄相似度度量方法的表達式為:
其中,q為Hs與Hd的匹配數,Hs與Hd分別為兩條醫保目錄對應的關鍵字位置鏈表,ω(·)表示醫保目錄對應的關鍵字鏈表長度。
4.根據權利要求2所述的用于醫療票據OCR的醫保目錄匹配方法,其特征在于,所述費用-目錄相似度度量方法為:
基于所述醫療票據OCR的費用明細與所述醫保目錄庫中的醫保目錄進行字符相似度匹配,完成所述費用-目錄相似度度量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州海量信息技術有限公司,未經杭州海量信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210087319.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于機械制造的多功能夾具
- 下一篇:一種電磁閥導向鐵芯加工車床





