[發明專利]基于文字識別的組件集展示方法、裝置和計算機設備有效
| 申請號: | 201911304399.1 | 申請日: | 2019-12-17 |
| 公開(公告)號: | CN111190576B | 公開(公告)日: | 2022-09-23 |
| 發明(設計)人: | 石興;肖趙棟 | 申請(專利權)人: | 深圳平安醫療健康科技服務有限公司 |
| 主分類號: | G06F8/20 | 分類號: | G06F8/20 |
| 代理公司: | 深圳市明日今典知識產權代理事務所(普通合伙) 44343 | 代理人: | 王杰輝 |
| 地址: | 518000 廣東省深圳市福田區華*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 文字 識別 組件 展示 方法 裝置 計算機 設備 | ||
1.一種基于文字識別的組件集展示方法,其特征在于,包括:
利用預設攝像頭采集預設的業務邏輯圖,其中,所述業務邏輯圖由多個實體按指定邏輯順序組合而成;所述多個實體包括第一實體和第二實體,所述第一實體由印刷體文字書寫,所述第二實體由手寫體文字書寫;
根據預設的文字識別方法,對所述業務邏輯圖進行文字識別,從而得到初始單詞序列,其中所述初始單詞序列由第一單詞和第二單詞構成,所述第一單詞指識別所述第一實體而得的單詞,所述第二單詞指識別所述第二實體而得的單詞;
從預存的標注單詞序列庫中調取第一標注單詞序列,并計算所述初始單詞序列和所述第一標注單詞序列的第一相似度值;其中所述第一標注單詞序列由第三單詞和第四單詞構成,所述第三單詞與所述第一單詞對應,所述第四單詞與所述第二單詞對應,并且所述第一標注單詞序列與預存的第一組件集對應,所述第一標注單詞序列中的單詞與所述第一組件集中的組件對應;
判斷所述第一相似度值是否大于預設的相似閾值;
若所述第一相似度值不大于預設的相似閾值,則執行組件替換操作,以將所述第一組件集中的部分組件替換為備用組件,從而得到第二組件集和所述第二組件集對應的第二標注單詞序列,其中所述組件替換操作遵循優先替換所述第三單詞對應的組件的原則;
計算所述初始單詞序列和所述第二標注單詞序列的第二相似度值,并判斷所述第二相似度值是否大于預設的相似閾值;
若所述第二相似度值大于預設的相似閾值,則按照所述指定邏輯順序,展示所述第二組件集;
所述從預存的標注單詞序列庫中調取第一標注單詞序列,并計算所述初始單詞序列和所述第一標注單詞序列的第一相似度值的步驟,包括:
通過查詢預設的詞向量庫,獲取所述初始單詞序列中每個單詞對應的詞向量,并以順序連接的方式組合成初始句向量(C1,C2,...,Ci,...Cm);以及獲取所述第一標注單詞序列中每個單詞對應的詞向量,并以順序連接的方式組合成第一標注句向量(D1,D2,...,Di,...Dm);
根據公式:
計算所述初始句向量(C1,C2,...,Ci,...Cm)和所述第一標注句向量(D1,D2,...,Di,...Dm)的相似度值Sim,并將所述相似度值Sim記為所述初始單詞序列和所述第一標注單詞序列的第一相似度值。
2.根據權利要求1所述的基于文字識別的組件集展示方法,其特征在于,所述根據預設的文字識別方法,對所述業務邏輯圖進行文字識別,從而得到初始單詞序列,其中所述初始單詞序列由第一單詞和第二單詞構成,所述第一單詞指識別所述第一實體而得的單詞,所述第二單詞指識別所述第二實體而得的單詞的步驟,包括:
將所述業務邏輯圖輸入文字識別模型中的第一識別架構中,得到所述第一識別架構輸出的所述第一單詞;其中所述文字識別模型由所述第一識別架構和預設的第二識別架構組成,所述第一識別架構利用第一樣本數據訓練而成,所述第一樣本數據由預先收集的文字圖片和所述文字圖片中的印刷體文字標識所構成,所述文字圖片中包括印刷體文字和手寫體文字;
將所述業務邏輯圖輸入所述第二識別架構中,得到所述第二識別架構輸出的總文字;其中所述第二識別架構利用第二樣本數據訓練而成,所述第二樣本數據由所述文字圖片和所述文字圖片中的所有文字標識所構成,其中所述所有文字標識不區分印刷體與手寫體;
從所述總文字中去除所述第一單詞,從而得到所述第二單詞,并將所述第一單詞和所述第二單詞組建成所述初始單詞序列。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳平安醫療健康科技服務有限公司,未經深圳平安醫療健康科技服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911304399.1/1.html,轉載請聲明來源鉆瓜專利網。





