[發明專利]文本識別方法、系統、機器設備和計算可讀存儲介質有效
| 申請號: | 201810338760.1 | 申請日: | 2018-04-16 |
| 公開(公告)號: | CN108596181B | 公開(公告)日: | 2022-02-25 |
| 發明(設計)人: | 蒲俊峰 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06V30/148 | 分類號: | G06V30/148;G06F8/60 |
| 代理公司: | 深圳市隆天聯鼎知識產權代理有限公司 44232 | 代理人: | 劉抗美;葉虹 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 識別 方法 系統 機器設備 計算 可讀 存儲 介質 | ||
1.一種文本識別方法,其特征在于,所述方法包括:
接收文本識別請求,所述文本識別請求攜帶請求識別文本的源信息;
在文本識別架構中進行文本識別的路由處理,分發所述文本識別請求至所述文本識別架構中相適應的業務組件;
通過所在業務組件至其它業務組件中服務的串聯執行處理所述文本識別請求,并且在識別所標記文本的業務組件將長耗時文本識別請求分離至異常識別服務,所述文本識別架構中各業務組件串行部署,所述業務組件至其它業務組件中服務的串聯執行處理,是串行部署的所述業務組件上完成服務執行的文本識別請求向下一業務組件的分發和服務的執行;
通過所述異常識別服務獲得所述文本識別請求為所攜帶源信息請求識別文本而對應的異常識別結果。
2.根據權利要求1所述的方法,其特征在于,所述源信息包括動態圖片和/或視頻流,所述在文本識別架構中進行文本識別的路由處理,分發所述文本識別請求至所述文本識別架構中相適應的業務組件,包括:
從所述文本識別請求提取請求識別文本的動態圖片和/或視頻流;
在文本識別架構中對所述動態圖片和/或視頻流進行路由處理,將所述動態圖片和/或視頻流分發至切分業務組件。
3.根據權利要求1所述的方法,其特征在于,所述通過所在業務組件至其它業務組件中服務的串聯執行處理所述文本識別請求,并且在識別所標記文本的業務組件將長耗時文本請求分離至異常識別服務,包括:
進行路由處理而分發得到文本識別請求的業務組件對所述文本識別請求執行自身所配置服務,以處理所述文本識別請求所傳入的源信息;
在所述服務執行完畢時通過串行部署的其它業務組件串聯執行所部署的服務獲得標記了文本區域的源信息,并將標記了文本區域的源信息傳入識別所標記文本的業務組件;
識別所標記文本的業務組件檢測所述文本識別請求是否為長耗時文本識別請求;
在所述文本識別請求是長耗時文本識別請求時,將對應于所述長耗時文本請求且標記了文本區域的源信息分離至異常識別服務。
4.根據權利要求3所述的方法,其特征在于,所述業務組件為切分業務組件,所述進行路由處理而分發得到文本識別請求的業務組件對所述文本識別請求執行自身所配置服務,以處理所述文本識別請求所傳入的源信息,包括:
所述切分業務組件接收所從文本識別請求中提取并分發的動態圖片和/或視頻流,對所述動態圖片和/或視頻流執行切分服務,獲得圖片序列。
5.根據權利要求4所述的方法,其特征在于,所述動態圖片和/或視頻流所在的切分業務組件中,進行所述動態圖片和/或視頻流切分,獲得圖片序列,包括:
通過所述切分業務組件中切分服務的執行,對路由分發所得到的動態圖片和/或視頻流進行相似幀抽取獲得若干圖片形成的圖片序列。
6.根據權利要求3所述的方法,其特征在于,所述識別所標記文本的業務組件檢測所述文本識別請求為長耗時文本請求之后,
所述通過所在業務組件至其它業務組件中服務的串聯執行處理所述文本識別請求,并且在識別所標記文本的業務組件將長耗時文本識別請求分離至異常識別服務,包括:
如果識別所標記文本的業務組件檢測所述文本識別請求為正常請求,則將對應于所述正常請求且標記了文本區域的源信息分離至識別服務,所述識別服務成功識別所述文本區域獲得文本信息所形成的識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810338760.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:圖像中的參數識別、參數識別模型的訓練方法及裝置
- 下一篇:滿文部件切分方法





