[發(fā)明專利]語境化字符識(shí)別系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 202011515538.8 | 申請(qǐng)日: | 2020-12-21 |
| 公開(公告)號(hào): | CN113076939A | 公開(公告)日: | 2021-07-06 |
| 發(fā)明(設(shè)計(jì))人: | R.K.古普塔;J.赫內(nèi);A.R.卡蒂 | 申請(qǐng)(專利權(quán))人: | SAP歐洲公司 |
| 主分類號(hào): | G06K9/20 | 分類號(hào): | G06K9/20;G06K9/32;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京市柳沈律師事務(wù)所 11105 | 代理人: | 邵亞麗 |
| 地址: | 德國瓦*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語境 字符 識(shí)別 系統(tǒng) | ||
1.一種用于提供語境化字符識(shí)別系統(tǒng)的方法,包括:
確定圖像的多個(gè)預(yù)測(cè)單詞,其中所述多個(gè)預(yù)測(cè)單詞是基于圖像的光學(xué)分析生成的;
為多個(gè)預(yù)測(cè)單詞中的每一個(gè)識(shí)別準(zhǔn)確性度量;
基于可替換單詞的準(zhǔn)確性度量低于閾值,從多個(gè)可預(yù)測(cè)單詞中識(shí)別可替換單詞;
識(shí)別與可替換單詞相關(guān)聯(lián)的多個(gè)候選單詞;
基于相對(duì)于多個(gè)預(yù)測(cè)單詞中的一個(gè)或多個(gè)的每個(gè)候選單詞的語境分析,為多個(gè)候選單詞中的每一個(gè)計(jì)算概率;
選擇多個(gè)候選單詞中的具有最高概率的一個(gè),其中選擇的候選單詞的概率超過準(zhǔn)確性度量和閾值;以及
輸出包括替換可替換單詞的具有最高概率的選擇的候選單詞的多個(gè)預(yù)測(cè)單詞。
2.根據(jù)權(quán)利要求1所述的方法,還包括:
接收?qǐng)D像;
識(shí)別圖像中的多個(gè)字符;以及
將多個(gè)字符組合成多個(gè)預(yù)測(cè)單詞。
3.根據(jù)權(quán)利要求1所述的方法,其中基于語境分析計(jì)算準(zhǔn)確性度量,在語境分析中,出現(xiàn)在多個(gè)預(yù)測(cè)單詞中的選擇的一個(gè)之前的一個(gè)或多個(gè)預(yù)測(cè)單詞的短語與出現(xiàn)在多個(gè)預(yù)測(cè)單詞中的選擇的一個(gè)之后的一個(gè)或多個(gè)預(yù)測(cè)單詞的短語進(jìn)行比較。
4.根據(jù)權(quán)利要求1所述的方法,其中,所述識(shí)別多個(gè)候選單詞包括:
確定可替換單詞包括多個(gè)字符;
為多個(gè)字符中的至少一個(gè)識(shí)別替代字符;以及
將包括替代字符的可替換單詞識(shí)別為是多個(gè)候選單詞中的一個(gè)。
5.根據(jù)權(quán)利要求4所述的方法,其中所述識(shí)別替代字符基于多個(gè)字符中的至少一個(gè)的光學(xué)分析。
6.根據(jù)權(quán)利要求1所述的方法,其中所述識(shí)別多個(gè)候選單詞包括:
使用具有多個(gè)閾值的非最大抑制來生成多個(gè)候選單詞中的一個(gè)。
7.根據(jù)權(quán)利要求1所述的方法,其中所述識(shí)別多個(gè)候選單詞包括:
跨用于可替換單詞中的至少一個(gè)字符的多個(gè)像素,針對(duì)每一個(gè)像素識(shí)別字符預(yù)測(cè),其中可替換單詞包括多個(gè)字符;
確定跨多個(gè)像素存在至少兩個(gè)不同的預(yù)測(cè),包括第一預(yù)測(cè)和第二預(yù)測(cè);以及
識(shí)別包括第一預(yù)測(cè)和多個(gè)字符的多個(gè)候選單詞中的第一個(gè)。
8.根據(jù)權(quán)利要求7所述的方法,還包括:
識(shí)別包括第二預(yù)測(cè)和多個(gè)字符的多個(gè)候選單詞中的第二個(gè)。
9.一種用于提供語境化字符識(shí)別系統(tǒng)的系統(tǒng),包括:
存儲(chǔ)器;以及
至少一個(gè)處理器,耦合到存儲(chǔ)器并被配置為執(zhí)行操作,所述操作包括:
確定圖像的多個(gè)預(yù)測(cè)單詞,其中所述多個(gè)預(yù)測(cè)單詞是基于圖像的光學(xué)分析生成的;
為多個(gè)預(yù)測(cè)單詞中的每一個(gè)識(shí)別準(zhǔn)確性度量;
基于可替換單詞的準(zhǔn)確性度量低于閾值,從多個(gè)可預(yù)測(cè)單詞中識(shí)別可替換單詞;
識(shí)別與可替換單詞相關(guān)聯(lián)的多個(gè)候選單詞;
基于相對(duì)于多個(gè)預(yù)測(cè)單詞中的一個(gè)或多個(gè)的每個(gè)候選單詞的語境分析,為多個(gè)候選單詞中的每一個(gè)計(jì)算概率;
選擇多個(gè)候選單詞中的具有最高概率的一個(gè),其中選擇的候選單詞的概率超過準(zhǔn)確性度量和閾值;以及
輸出包括替換可替換單詞的具有最高概率的選擇的候選單詞的多個(gè)預(yù)測(cè)單詞。
10.根據(jù)權(quán)利要求9所述的系統(tǒng),其中所述操作還包括:
接收?qǐng)D像;
識(shí)別圖像中的多個(gè)字符;以及
將多個(gè)字符組合成多個(gè)預(yù)測(cè)單詞。
11.根據(jù)權(quán)利要求9所述的系統(tǒng),其中基于語境分析計(jì)算準(zhǔn)確性度量,在語境分析中,出現(xiàn)在多個(gè)預(yù)測(cè)單詞中的選擇的一個(gè)之前的一個(gè)或多個(gè)預(yù)測(cè)單詞的短語與出現(xiàn)在多個(gè)預(yù)測(cè)單詞中的選擇的一個(gè)之后的一個(gè)或多個(gè)預(yù)測(cè)單詞的短語進(jìn)行比較。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于SAP歐洲公司,未經(jīng)SAP歐洲公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011515538.8/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 用于管理語境相關(guān)信息的系統(tǒng)、移動(dòng)站、方法和計(jì)算機(jī)程序產(chǎn)品
- 文字輸入過程中的自動(dòng)校對(duì)方法
- 使用與信息關(guān)聯(lián)的語義語境便于協(xié)作搜索
- 記錄語境信息以及追溯生詞語境的方法和系統(tǒng)
- 基于語境的鍵盤
- 用于管理語音系統(tǒng)中的對(duì)話語境的系統(tǒng)和方法
- 用于管理語境相關(guān)信息的系統(tǒng)、移動(dòng)站和方法
- 減少主觀干擾內(nèi)容的方法和系統(tǒng)
- 依存句法樹構(gòu)建系統(tǒng)
- 會(huì)話語境劃分方法與系統(tǒng)、交互方法與交互系統(tǒng)
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





