[發明專利]一種文本語義分析方法及系統在審
| 申請號: | 202010070024.X | 申請日: | 2020-01-21 |
| 公開(公告)號: | CN111241849A | 公開(公告)日: | 2020-06-05 |
| 發明(設計)人: | 胡順仁;馬宇航 | 申請(專利權)人: | 重慶理工大學 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F16/35;G06N3/04 |
| 代理公司: | 重慶華科專利事務所 50123 | 代理人: | 康海燕 |
| 地址: | 400054 重*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 語義 分析 方法 系統 | ||
本發明提供了一種文本語義分析方法及系統,包括:提取表示文本語義的文本向量,然后將文本向量輸入到基于卷積神經網絡包含有TextCNN與FastCNN中的網絡結構進行特征提取。通過在TextCNN增加卷積核的種類或數量,增加了該網絡結構的寬度,使得卷積層的特征提取能力大大增強,采用類似于“殘差神經網絡結構”的連接方式,使得卷積層輸出的第一向量與被FastCNN網絡結構壓縮的文本向量聯結形成第二向量,第二向量經過全連接層傳輸至輸出層,得到文本向量分類各類別的概率。使得從文本語義提取到的初始文本向量通過TextCNN的卷積池化非線性處理與FastCNN的線性處理等篩選方式映射為一系列隱性文本向量,實現了更加高效且精準地獲取到文本向量的分類結果。
技術領域
本發明涉及計算機人工智能的技術領域,尤其涉及一種文本語義分析方法及系統。
背景技術
人工智能(Artificial Intelligence),英文縮寫為AI。它是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學,也是計算機科學的一個分支,它企圖了解智能思維模式的實質,并生產出一種新的能與人類思維模式相近,且同樣能做出相應反應的智能機器。該領域的研究方向包括機器人、語言識別、圖像識別和自然語言處理等,其中,自然語言處理是計算機科學領域與人工智能領域中的一個重要方向。它研究能實現人與計算機之間用自然語言進行有效通信的各種理論和方法。市場上的眾多APP軟件都會向用戶終端主動推送一些文本語義相關的新聞。但是推送的內容,一些用戶可能對此不感興趣,長時間地被迫接受不感興趣的新聞內容,可能會影響到用戶的使用體驗,因此需要通過人工智能的方法,對推送內容進行篩選,但是一般的推送有效內容信息的效率并不高。
目前,在人工智能領域的自然語言篩選方面以卷積神經網絡為代表的深度學習更為突出,通過卷積神經網絡能以更高的效率提取出更加優化的隱藏特征,用于反映自然語言文本中所包含的語義信息。
因此,有必要開發一種文本語義分析方法及系統。
發明內容
有鑒于此,本發明的目的在于提供一種文本語義分析方法及系統,更加高效地解決在精準提取有效文本向量的技術問題。
第一方面,本發明提供了一種文本語義分析方法,包括:提取表示所述文本語義的文本向量;將所述文本向量輸入到網絡結構中,其中,所述網絡結構包括TextCNN網絡結構與FastCNN網絡結構,基于卷積神經網絡對文本向量進行特征提取;獲取所述網絡結構輸出的文本特征向量。
進一步地,將所述文本向量輸入到所述網絡結構中,具體步驟包括:將提取到的表示所述文本語義的文本向量輸入至四種不同類型的卷積核中,在卷積層進行卷積處理;當提取到的所述文本語義的文本向量在卷積層完成卷積處理后,通過Chunk-Maxpooling在池化層進行池化處理,得到四類隱形特征矩陣;在得到所述四類隱形特征矩陣后,通過Flatten層將四類隱形特征矩陣展平為一維向量,通過Concatenate層后拼接為第一向量。
進一步地,所述四種不同類型的卷積核包括:5行一維卷積窗口、4行一維卷積窗口、3行一維卷積窗口和2行一維卷積窗口,其中,每種一維卷積窗口上的卷積核數量為三位數的數量級。
進一步地,所述第一向量與被所述FastCNN網絡結構壓縮的文本向量聯結形成第二向量,所述第二向量經過全連接層傳輸至輸出層,得到所述網絡結構輸出的文本特征向量。
進一步地,所述文本特征向量包括文本向量分類各類別的概率。
第二方面,本發明還提供了一種文本語義分析系統,所述文本語義分析系統包括:提取單元,用于提取表示所述文本語義的文本向量;輸入單元,用于將所述文本向量輸入到網絡結構中,其中,所述網絡結構包括TextCNN網絡結構與FastCNN網絡結構,基于卷積神經網絡對文本向量進行特征提取;獲取單元,用于獲取所述網絡結構輸出的文本特征向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶理工大學,未經重慶理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010070024.X/2.html,轉載請聲明來源鉆瓜專利網。





