[發明專利]一種基于語形特征的語義識別分析方法在審
| 申請號: | 201910919960.0 | 申請日: | 2019-09-26 |
| 公開(公告)號: | CN110728152A | 公開(公告)日: | 2020-01-24 |
| 發明(設計)人: | 宋凌俊 | 申請(專利權)人: | 宋凌俊 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06N3/08 |
| 代理公司: | 32320 南京禾易知識產權代理有限公司 | 代理人: | 張松云 |
| 地址: | 311507 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 神經網絡 語義分析 語義識別 輸出 語句 語言數據資源 正則表達式 前向傳播 語義背景 語義場景 網絡 二叉樹 特征集 算法 稠密 分析 篩選 | ||
本發明涉及一種基于語形特征的語義識別分析方法,包括如下步驟:確定問語的特征集,并經過二叉樹和正則表達式的篩選,得到與問語語義最相似的待定語;從待定語網絡中確定可能答語,在待定語網絡中將上述第一步得到的與問語最相似待定語的后續語句作為問語的若干可能答語;將問語作為語義分析神經網絡的輸入,以若干答語包含的詞包括可代替變元的詞作為輸出,對語義分析神經網絡進行前向傳播,得到輸出詞節點的值,根據詞節點的輸出值確定變元及最終答語。本發明的語義識別分析方法,能夠使得算法運行所依托的語言數據資源更加豐富,語句網絡更加稠密,獲得的答語更加符合問語及其語義背景所限定的語義場景。
技術領域
本發明涉及語義識別領域,尤其涉及一種基于語形特征的語義識別分析方法。
背景技術
隨著互聯網的飛速發展,智能設備上的對話系統中已經引入了語義理解技術,從而自然語言對話系統已成為人們普遍使用的一種溝通工具。
目前,實現自然語言對話系統的基本技術可以分為兩大類,基于規則的方法和基于統計的方法。其中,基于規則的方法是指根據定義的語法規則、詞性和構詞與構句規則等,使用計算機語言進行描述;基于統計的方法是指采用深度學習和大數據,構建對話系統,并自動生成對話。實際使用中,現有的對話識別系統對于用戶意圖的識別能力不高,經常會出現因為無法判別用戶意圖而出現無法回答用戶的情況,或者出現答非所問或重復回答的情況,使得對話系統構建的對話內容太過局限,用戶體驗不高。
因此,如何設計一種新的語義識別分析方法,以提高語義識別的準確性成為亟待解決的技術問題。
發明內容
本發明的目的在于提供一種基于語形特征的語義識別分析方法,語言數據資源更加豐富,語句網絡更加稠密,獲得的答語更加符合問語及其語義背景所限定的語義場景。
為實現上述目的,本發明的技術方案如下:
一種基于語形特征的語義識別分析方法,包括如下步驟:
確定問語的特征集,從一級到若干級逐級與二叉樹的各級左、右分支對應的分支特征集進行交集運算,根據交集的大小,逐級確定分支直至定位到一定深度的二叉樹分支上,再將此分支對應的語句集逐句與問語正則匹配,得到與問語語義最相似的待定語;
從待定語網絡中確定可能答語,在待定語網絡中將上述第一步得到的與問語最相似待定語的后續語句作為問語的若干可能答語;
將問語作為語義分析神經網絡的輸入,以若干答語包含的詞包括可代替變元的詞作為輸出,對語義分析神經網絡進行前向傳播,得到輸出詞節點的值,根據詞節點的輸出值,取輸出值較大者代替變元,再以可能答語的平均值最大者為最終答語。
進一步地,所述語義分析神經網絡包括輸入層、中間層和輸出層;選擇中文詞、字作為輸入層、中間層和輸出層的節點,在輸入層和中間層、中間層和輸出層之間加入若干間隔層,將節點之間的權值和節點偏置值隨機初始化,并設置激活函數;以前后相續的問語和答語作為語義分析神經網絡訓練的一組對象,將輸入層中屬于問語的詞節點激活,其余不激活,將輸出層中屬于答語的詞節點包括可代替變元的詞作為輸出節點。
進一步地,所述語義分析神經網絡的前向傳播方法得到輸出節點的網絡輸出,與目標值進行誤差計算,再將誤差用后向傳播方法進行神經網絡權值和偏置值修改,經過多輪訓練,使誤差減小到設定值以下。
進一步地,所述輸入層至中間層組成第一子神經網絡,中間層至輸出層組成第二子神經網絡,在神經網絡的前向傳播過程中,對中間層屬于問語的詞節點給與前向傳播高輸出,其余節點給與低輸出,在神經網絡的后向傳播中,根據設定輸出對于中間層的相關偏導予以修正。
進一步地,所述待定語句集的具體獲取方式為,逐句統計一系列對話式語言文本,將不同語句中具有相同臨近詞的詞采用變元替換,生成各待定語句且每個變元對應一個集合,集合內的成員即各語句中變元所在處的詞,所有待定語句組成待定語句集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于宋凌俊,未經宋凌俊許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910919960.0/2.html,轉載請聲明來源鉆瓜專利網。





