[發明專利]基于人工智能現實場景下的中文意義詞組的識別方法和系統在審
| 申請號: | 202010668276.2 | 申請日: | 2020-07-13 |
| 公開(公告)號: | CN112001380A | 公開(公告)日: | 2020-11-27 |
| 發明(設計)人: | 高旻昱;遲崇明;李潤發 | 申請(專利權)人: | 上海翎騰智能科技有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06F16/332;G06F16/36;G06K9/34;G06K9/62 |
| 代理公司: | 上海漢聲知識產權代理有限公司 31236 | 代理人: | 胡晶 |
| 地址: | 201203 上海市浦東新區中國*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人工智能 現實 場景 中文 意義 詞組 識別 方法 系統 | ||
1.一種基于人工智能現實場景下的中文意義詞組的識別方法,其特征在于,所述識別方法包括:
S1:獲取采集的真實場景下包括信息載體和交互載體在內的實時交互圖像;
S2:將所述實時交互圖像與預先設定的信息載體和交互載體,通過以FPN結構網絡的卷積神經網絡為核心的圖像深度學習AI模型進行匹配識別,輸出所述信息載體和所述交互載體;
S3:根據所述信息載體和所述交互載體,利用手指定位人工智能算法,識別出所述交互載體在所述信息載體中的位置信息和觸發動作信息,后通過數學邏輯綜合信息計算識別出所述交互載體進行觸發動作的所在所述信息載體上的中心焦點,以及利用以卷積神經網絡為核心的圖像目標識別深度學習AI模型識別獲取中心焦點兩邊的中文圖像信息,并使用深度學習文本識別OCR技術獲取中文文字信息;
S4:根據識別出的中心焦點及其兩邊的中文文字信息,利用字典對中文文字信息組成的中文文字序列進行匹配檢索,獲取文字組合;后利用詞典對文字組合進行匹配檢索,獲取文字組合的中文意義后輸出。
2.如權利要求1所述的基于人工智能現實場景下的中文意義詞組的識別方法,其特征在于,所述步驟S3進一步包括:
S31:接收所述實時交互圖像中的所述信息載體和所述交互載體,通過使用以Densenet結構網絡的卷積神經網絡為核心的圖像深度學習AI模型,或者使用基于Resnet或vgg或darknet結構的圖像識別主干網絡,以基于高斯分布密度衰減函數的位置信息損失函數為迭代指標,識別所述交互載體在所述信息載體中的位置信息和觸發動作信息;
S32:對所述交互載體的觸發動作區域進行圖像切割,獲取以所述觸發動作區域為中心焦點區域的單一干凈文字圖像;
其中,所述單一干凈文字圖像為所述交互圖像中僅包含中文文字本身以及其所必要覆蓋的背景區域,不包括任何遠離中文文字的背景或其他圖像信息;
S33:對所述單一干凈文字圖像的中心焦點區域進行標記處理分析,得出中心焦點文字在水平方向的角度信息,并根據角度信息對所述單一干凈文字圖像進行旋轉調整,以獲取水平的所述單一干凈文字圖像;
S34:在經過對所述單一干凈文字圖像的中心焦點區域標記處理及旋轉后,同時向所述中心焦點區域的左邊和右邊獲取一組潛在文字區域圖像;
S35:對所述潛在文字區域圖像進行區域切割分析,獲得普通焦點區域的新單一干凈文字圖像;
S36:對新單一干凈文字圖像信息進行判別分析,文字圖像識別人工智能算法,判斷出所述新單一干凈文字圖像包含有中文圖像信息或者非中文圖像信息,若包含中文圖像信息則識別該中文圖像信息,并進入步驟S27,否則對非中文圖像信息進行標記;
S37:對包含有中文文字信息的普通焦點區域,在其遠離中心焦點區域的方向,向左或向右獲取一組新的潛在文字區域圖像,并重復25-26步驟,直到某一步的普通焦點區域沒有中文文字信息或者達到最大迭代步數后停止,返回識別出文字信息。
3.如權利要求2所述的基于人工智能現實場景下的中文意義詞組的識別方法,其特征在于,重復34-37步驟,獲取中心焦點區域左右兩邊多個中文文字信息,其中,中文文字數量取決于左右兩邊最大迭代次數。
4.如權利要求2所述的基于人工智能現實場景下的中文意義詞組的識別方法,其特征在于,所述步驟S32中:利用中文文字切割人工智能算法,獲取所述交互載體所指向的中文圖像信息,得到所述交互載體的觸發動作區域的中心焦點區域的單一干凈文字圖像。
5.如權利要求2所述的基于人工智能現實場景下的中文意義詞組的識別方法,其特征在于,所述步驟S36中:對包含有中文圖像信息的普通焦點區域的單一干凈文字圖像,利用文字圖像識別人工智能算法,獲得單一干凈文字圖像中的中文圖像信息。
6.如權利要求1所述的基于人工智能現實場景下的中文意義詞組的識別方法,其特征在于,所述步驟S1之前還包括:采集并預存真實場景下的信息載體,以便進行匹配。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海翎騰智能科技有限公司,未經上海翎騰智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010668276.2/1.html,轉載請聲明來源鉆瓜專利網。





