[發(fā)明專利]一種基于自然語言語義分析的文本識別方法在審
| 申請?zhí)枺?/td> | 202110635441.9 | 申請日: | 2021-06-07 |
| 公開(公告)號: | CN113569577A | 公開(公告)日: | 2021-10-29 |
| 發(fā)明(設計)人: | 劉如君;劉志杰;陳喬;尚雪松 | 申請(專利權)人: | 北京微智信業(yè)科技有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/279;G06F40/151;G06F40/216 |
| 代理公司: | 北京冠和權律師事務所 11399 | 代理人: | 趙銀萍 |
| 地址: | 100000 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 自然語言 語義 分析 文本 識別 方法 | ||
本發(fā)明提供了一種基于自然語言語義分析的文本識別方法,包括:建立自然語言語義和標準語言語義的對應關系映射集;獲取文本信息,提取文本中的語言信息,通過對應關系映射集識別語言信息中的標準語言語義和非標準語言語義;將非標準語言語義信息輸入非標準語言語義分析系統(tǒng)分析判定,完成文本識別;融合了自然環(huán)境中語言語義的分析和同時進行文本識別,使得在對所獲取的文本在進行自然語言語義分析時,有益于在自然語言語義的環(huán)境下對文本快速、精準、多類型同時識別。
技術領域
本發(fā)明涉及到文本識別領域,尤其涉及一種基于自然語言語義分析的文本識別方法
背景技術
目前,隨著自然語言處理技術的發(fā)展,基于通用信息的語言識別和語義分析技術逐漸提高,但在一些特有領域,識別正確率和理解正確率都非常低,自然語言語義和標準語言語義的對應關系問題仍需進一步解決;同時由于自然環(huán)境中的自然語言或視頻所包含的文字字符不清晰或被損壞,導致識別率低;如何提取文本中的語言信息并識別語言信息中的標準語言語義和非標準語言語義是尚待完善解決的技術;如何對非標準語言語義信息進行分析判定,技術尚未完全成熟;因此,有必要提出一種基于自然語言語義分析的文本識別方法,以至少部分地解決現(xiàn)有技術中存在的問題。
發(fā)明內(nèi)容
本發(fā)明提供一種基于自然語言語義分析的文本識別方法,用于解決自然環(huán)境中的文本識別。一種基于自然語言語義分析的文本識別方法,包括:
建立自然語言語義和標準語言語義的對應關系映射集;
獲取文本信息,提取文本中的語言信息,通過對應關系映射集識別語言信息中的標準語言語義和非標準語言語義;
將非標準語言語義信息輸入非標準語言語義分析系統(tǒng)分析判定,完成文本識別。
優(yōu)選的,其特征在于,所述建立自然語言語義和標準語言語義的對應關系映射集包括:
步驟1:獲取自然語言信息;
步驟2:提取自然語言信息的語義特征,識別自然語言信息語義信息所處的對應關系映射集區(qū)域范圍;
步驟3:根據(jù)識別出的文本區(qū)域,將所述區(qū)域中的文本與詞庫中的文本對比,得到初始的文本信息;
步驟4:基于所述的初始文本信息的特征,對文本信息進行分析;
步驟6:根據(jù)分析結(jié)果判斷所述文本信息特征的準確性及完整性;
步驟5:按照自然語言語序?qū)λ鑫谋拘畔⑦M行矯正;
步驟7:將文本字符進行分割,識別文本字符;
步驟8:將所述的識別出的文本字符輸入系統(tǒng)映射集中,得到完整準確的對應關系映射集。
優(yōu)選的,所述步驟4:基于所述的初始文本信息的特征,對文本信息進行分析,包括:識別文本在自然語言中的分布紋理;將分布紋理與背景紋理進行紋理對比度分析;當紋理對比度大于設定的限值,則識別為文本特征,進行提取;當紋理對比度不大于設定的限值,則識別為非文本。
優(yōu)選的,所述自然語言信息的特征包括:自然環(huán)境中有干擾噪聲場景的文本檢測與定位;對文本區(qū)域中低質(zhì)量、干擾嚴重的文本進行識別、根據(jù)文本區(qū)域的識別結(jié)果對自然語言或視頻數(shù)據(jù)中所包含的信息作進一步的解釋。
優(yōu)選的,所述:獲取文本信息,提取文本中的語言信息,通過對應關系映射集識別語言信息中的標準語言語義和非標準語言語義;其中,通過對應關系映射集識別語言信息中的標準語言語義和非標準語言語義;包括:
步驟S1,實時采集自然語言信息;
步驟S2,將采集到的所述自然語言信息進行信息類型判斷;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京微智信業(yè)科技有限公司,未經(jīng)北京微智信業(yè)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110635441.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種氣動碼釘槍
- 下一篇:伯克霍爾德氏菌酯合成酶、編碼基因及其應用





