[發明專利]醫療字段映射校驗方法及裝置有效
| 申請號: | 201611027722.1 | 申請日: | 2016-11-21 |
| 公開(公告)號: | CN108091372B | 公開(公告)日: | 2021-06-18 |
| 發明(設計)人: | 鄭號 | 申請(專利權)人: | 醫渡云(北京)技術有限公司 |
| 主分類號: | G16H10/60 | 分類號: | G16H10/60;G06F40/289;G06F16/33;G06F16/36 |
| 代理公司: | 北京律智知識產權代理有限公司 11438 | 代理人: | 闞梓瑄;王衛忠 |
| 地址: | 100191 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 醫療 字段 映射 校驗 方法 裝置 | ||
1.一種醫療字段映射校驗方法,其特征在于,包括:
接收待校驗字段,所述待校驗字段具有字段名稱且包括字段內容;
對所述待校驗字段的字段內容進行分詞得到多個第一切分詞;
將各所述第一切分詞分別表征為第一詞向量;
計算所述第一詞向量的平均值得到所述待校驗字段的中心向量;
分別計算所述待校驗字段的中心向量與多個參照字段的中心向量的相似度;
結合所述相似度從所述多個參照字段中確定目標參照字段;其中,所述目標參照字段為與所述待校驗字段的相似程度最高的參照字段;
比較所述待校驗字段與所述目標參照字段的名稱,并根據比較結果確認所述待校驗字段的字段內容與字段名稱的映射關系是否正確。
2.根據權利要求1所述的醫療字段映射校驗方法,其特征在于,還包括計算所述參照字段的中心向量的步驟,包括:
接收所述參照字段,所述參照字段具有字段名稱且包括字段內容;
對所述參照字段的字段內容進行分詞得到多個第二切分詞;
將各所述第二切分詞分別表征為第二詞向量;
計算所述第二詞向量的平均值得到所述參照字段的中心向量。
3.根據權利要求2所述的醫療字段映射校驗方法,其特征在于,所述將各所述第二切分詞分別表征為第二詞向量包括:
對至少包含所述多個參照字段的參照語料庫進行分詞得到多個第三切分詞;
將各所述第三切分詞分別表征為第三詞向量,并構建各所述第三切分詞與所述第三詞向量之間的映射關系;
在所述第三切分詞與第三詞向量之間的映射關系中查找與所述第二切分詞相同的所述第三切分詞對應的所述第三詞向量作為所述第二切分詞的所述第二詞向量。
4.根據權利要求3所述的醫療字段映射校驗方法,其特征在于,所述將各所述第一切分詞分別表征為第一詞向量包括:
在所述第三切分詞與第三詞向量之間的映射關系中查找與所述第一切分詞相同的所述第三切分詞對應的所述第三詞向量作為所述第一切分詞的所述第一詞向量。
5.根據權利要求4所述的醫療字段映射校驗方法,其特征在于,所述結合所述相似度從所述多個參照字段中確定目標參照字段包括:
在所述多個參照字段中選取相似度最高的預定數量的參照字段作為候選參照字段;
基于所述參照語料庫,根據預定模型計算出所述相似度的權重、字段平均長度的權重和字段離散度的權重,所述字段離散度為字段包含的最高頻詞所占的百分數;
根據所述相似度、所述字段平均長度、所述字段離散度及其各自的權重計算出各個所述候選參照字段的加權得分;
選取所述加權得分最高的候選參照字段作為所述目標參照字段。
6.根據權利要求5所述的醫療字段映射校驗方法,其特征在于,所述預定模型為決策樹模型。
7.根據權利要求1所述的醫療字段映射校驗方法,其特征在于,所述相似度為余弦相似度。
8.一種醫療字段映射校驗裝置,其特征在于,包括:
接收單元,用于接收待校驗字段,所述待校驗字段具有字段名稱且包括字段內容;
分詞單元,用于對所述待校驗字段的字段內容進行分詞得到多個第一切分詞;
表征單元,用于將各所述第一切分詞分別表征為第一詞向量;
第一計算單元,用于計算所述第一詞向量的平均值得到所述待校驗字段的中心向量;
第二計算單元,用于分別計算所述待校驗字段的中心向量與多個參照字段的中心向量的相似度;
選取單元,根據所述相似度從所述多個參照字段中確定目標參照字段;其中,所述目標參照字段為與所述待校驗字段的相似程度最高的參照字段;
判斷單元,用于比較所述待校驗字段與所述目標參照字段的名稱,并根據比較結果確認所述待校驗字段的字段內容與字段名稱的映射關系是否正確。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于醫渡云(北京)技術有限公司,未經醫渡云(北京)技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611027722.1/1.html,轉載請聲明來源鉆瓜專利網。





