[發(fā)明專利]一種用于醫(yī)療票據(jù)OCR的醫(yī)保目錄匹配方法有效
| 申請?zhí)枺?/td> | 202210087319.7 | 申請日: | 2022-01-25 |
| 公開(公告)號: | CN114445842B | 公開(公告)日: | 2022-09-20 |
| 發(fā)明(設(shè)計)人: | 褚一平;陳士春;唐志學;鄭義;陳建勇;朱華山;郁星星;張雪妮;潘翔;趙小敏;鄭河榮;黃葉玨 | 申請(專利權(quán))人: | 杭州海量信息技術(shù)有限公司 |
| 主分類號: | G06V30/418 | 分類號: | G06V30/418;G06V30/10;G06F16/901;G06F16/903;G06F40/289 |
| 代理公司: | 北京盛詢知識產(chǎn)權(quán)代理有限公司 11901 | 代理人: | 方亞兵 |
| 地址: | 310012 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用于 醫(yī)療 票據(jù) ocr 醫(yī)保 目錄 匹配 方法 | ||
本發(fā)明公開一種用于醫(yī)療票據(jù)OCR的醫(yī)保目錄匹配方法,步驟包括,基于醫(yī)保目錄庫中的醫(yī)保目錄構(gòu)建醫(yī)保目錄庫熱力圖;設(shè)置醫(yī)保目錄相似度度量方法,所述醫(yī)保目錄相似度度量方法包括雙目錄相似度度量方法與費用?目錄相似度度量方法;基于所述醫(yī)保目錄庫熱力圖與所述雙目錄相似度度量方法構(gòu)建醫(yī)保目錄池塘結(jié)構(gòu)庫;基于所述目錄相似度度量方法與所述醫(yī)保目錄池塘結(jié)構(gòu)庫對醫(yī)療票據(jù)OCR的費用明細進行搜索,完成所述醫(yī)保目錄匹配。本發(fā)明能夠應(yīng)用于醫(yī)保業(yè)務(wù)相關(guān)系統(tǒng)中,提高系統(tǒng)的易用性和有效性。
技術(shù)領(lǐng)域
本發(fā)明屬于醫(yī)療票據(jù)OCR技術(shù)領(lǐng)域,尤其涉及一種用于醫(yī)療票據(jù)OCR的醫(yī)保目錄匹配方法。
背景技術(shù)
醫(yī)療保險已經(jīng)深入人心,是保障大眾生活質(zhì)量的重要組成部分,很多人不但參保社會醫(yī)療保險,還參保了商業(yè)補充醫(yī)療保險。隨著社會的發(fā)展,人口流動性非常大,目前醫(yī)療保險應(yīng)用場景非常復(fù)雜,還未完全做到各地各部門之間數(shù)據(jù)互通。在很多場景中,醫(yī)療保險的報銷或者理賠都需要提供紙質(zhì)的費用憑證。采用醫(yī)療票據(jù)OCR識別技術(shù)可以快速地把這些紙質(zhì)的費用憑證數(shù)據(jù)電子化。但是由于各種歷史原因,各地各部門提供的醫(yī)療費用明細與當?shù)氐尼t(yī)保目錄庫可能存在一定的差異;另外OCR識別技術(shù)提供的識別結(jié)果可能存在誤識別、英文或者符號半角全角不統(tǒng)一等情況。所以這些電子化后的費用憑證數(shù)據(jù)能正常入庫的關(guān)鍵是需要一套有效的方法保證這些費用數(shù)據(jù)能夠與醫(yī)保目錄庫正確匹配。
發(fā)明內(nèi)容
為解決上述問題,本發(fā)明提出一種用于醫(yī)療票據(jù)OCR的醫(yī)保目錄匹配方法,將名稱上有差異的同類醫(yī)療費用目錄關(guān)聯(lián)起來,為進一步提升醫(yī)保業(yè)務(wù)系統(tǒng)有效性和易用性提供基礎(chǔ)。
為實現(xiàn)上述目的,本發(fā)明提供了一種用于醫(yī)療票據(jù)OCR的醫(yī)保目錄匹配方法,所述方法包括,
基于醫(yī)保目錄庫中的醫(yī)保目錄構(gòu)建醫(yī)保目錄庫熱力圖;
設(shè)置醫(yī)保目錄相似度度量方法,所述醫(yī)保目錄相似度度量方法包括雙目錄相似度度量方法與費用-目錄相似度度量方法;
基于所述醫(yī)保目錄庫熱力圖與所述雙目錄相似度度量方法構(gòu)建醫(yī)保目錄池塘結(jié)構(gòu)庫;
基于所述費用-目錄相似度度量方法與所述醫(yī)保目錄池塘結(jié)構(gòu)庫對醫(yī)療票據(jù)OCR的費用明細進行搜索,完成所述醫(yī)保目錄匹配。
可選地,構(gòu)建所述醫(yī)保目錄庫熱力圖的方法為:
獲取所述醫(yī)保目錄的關(guān)鍵字字頻表;
基于所述關(guān)鍵字字頻表對醫(yī)保目錄的每個條目中的字符進行關(guān)鍵字匹配,獲取所述醫(yī)保目錄的熱力數(shù)據(jù);
基于所述熱力數(shù)據(jù)中的元素建立所述醫(yī)保目錄庫熱力圖。
可選地,獲取所述關(guān)鍵字字頻表的方法為:
對所述醫(yī)保目錄進行去非中文字符處理,獲得純中文字符的醫(yī)保目錄,對所述純中文字符的醫(yī)保目錄的條目進行中文分詞,獲得分詞集合,對所述分詞集合去重,采用人工的方式糾正錯誤分詞,并對所述糾正后的分詞再次去重,得到醫(yī)保目錄關(guān)鍵字集合,統(tǒng)計所述醫(yī)保目錄中每個中文字符的出現(xiàn)頻率,獲得字符頻率表,基于所述字符頻率表獲取所述醫(yī)保目錄關(guān)鍵字集合中的每條關(guān)鍵字中每個字符的頻率,計算所述關(guān)鍵字的全部字符頻率均值,將所述頻率均值作為所述關(guān)鍵字的字頻,在所述關(guān)鍵字集合中加入對應(yīng)的所述字頻,獲得關(guān)鍵字字頻表。
可選地,獲取所述醫(yī)保目錄的熱力數(shù)據(jù)的方法為:
建立空鏈表,基于所述關(guān)鍵字字頻表對所述醫(yī)保目錄的每個條目中的字符進行關(guān)鍵字匹配,基于匹配結(jié)果,將所述關(guān)鍵字的起止位置插入所述空鏈表中,插入所述關(guān)鍵字的起止位置后的所述空鏈表即所述醫(yī)保目錄的熱力數(shù)據(jù)。
可選地,構(gòu)建所述醫(yī)保目錄池塘結(jié)構(gòu)庫的方法為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州海量信息技術(shù)有限公司,未經(jīng)杭州海量信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210087319.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種用于機械制造的多功能夾具
- 下一篇:一種電磁閥導(dǎo)向鐵芯加工車床
- OCR文檔識別方法及其裝置
- 智能調(diào)度多OCR識別引擎的方法及設(shè)備
- OCR掛接方法、裝置與設(shè)備
- 一種用于教學系統(tǒng)的OCR識別方法、裝置和終端
- OCR識別模型的確定方法及裝置
- 基于聯(lián)邦OCR模型的字符檢測方法、裝置、設(shè)備和介質(zhì)
- OCR系統(tǒng)的評估方法、裝置、設(shè)備及可讀存儲介質(zhì)
- OCR模型訓(xùn)練方法、系統(tǒng)及裝置
- 識別轉(zhuǎn)換圖像文件的方法、系統(tǒng)、計算機設(shè)備及存儲介質(zhì)
- OCR訓(xùn)練數(shù)據(jù)生成方法、裝置、計算機設(shè)備及存儲介質(zhì)





