[發明專利]短文本語義理解模板檢驗方法、模板生成方法及裝置在審
| 申請號: | 202011364644.0 | 申請日: | 2020-11-27 |
| 公開(公告)號: | CN112395394A | 公開(公告)日: | 2021-02-23 |
| 發明(設計)人: | 李曉霞 | 申請(專利權)人: | 安徽迪科數金科技有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/332;G06F16/35;G06F40/30 |
| 代理公司: | 北京科迪生專利代理有限責任公司 11251 | 代理人: | 張乾楨 |
| 地址: | 230088 安徽省合肥市*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 語義 理解 模板 檢驗 方法 生成 裝置 | ||
一種短文本語義理解模板檢驗方法、模板生成方法及裝置,所述方法包括:步驟E1處理第1條待語義理解的短文本,對初步生成和/或優化過對應若干條規則模板的第1條待語義理解的短文本進行分類,轉存成已完成語義理解的短文本,同時存儲其與對應的若干個預設基礎語義組、及對應的若干條規則模板建立的正確匹配關系;步驟E2處理非第1條待語義理解的短文本,交互檢驗非第1條正在處理的待語義理解的短文本初步生成和/或優化過的若干條規則模板和現有的所有規則模板,交互檢驗通過后,同樣進行分類、轉存以及存儲對應的匹配關系;步驟E3對待語義理解的其余短文本,循環步驟E2,實現每條待語義理解的短文本的分類過程中都使用交互檢驗,每條規則模板反復經過交互檢驗。
技術領域
本申請涉及自然語言語義理解領域,尤其涉及一種短文本語義理解模板檢驗方法、模板生成方法及裝置。
背景技術
通過對人類自然語言的識別、理解、表達進行的人機智能交互給人們的生活帶來了極大便利,隨著語音識別準確率及泛化能力的不斷提高,人機智能交互逐漸應用于各種產品中,并被大眾熟悉。其中影響推廣應用和大眾體驗的關鍵技術之一是對自然語言經語音識別后的短文本的理解。
目前短文本理解方法大致分為基于匹配模板和基于機器學習模型的方法。前者多為關鍵詞提取、(分詞后)同義合并,abnf文法。現有的方法流程繁瑣、冗余難于管理,難以平衡準確率和匹配率,處理不了相對復雜的語義的分類,比如,局部語義與整體語義不一致、實際交互場景中人端口語化而非嚴格書面語言的表達、實際交互場景中不同語義寬窄的需求。基于機器學習模型的方法需要先有大量實際場景互動數據,耗時去標注,專業研發人員去訓練,才能得到達到一定準確率的模型,啟動成本昂貴,小型或者非專業企業很難使用,進一步導致沒辦法產生實際場景互動數據。
發明內容
本申請提供了一種短文本語義理解模板檢驗方法、模板生成方法及裝置,目的在于解決缺少實際生產數據情況下,現有技術中,短文本語義理解泛化過程中準確率不可把控、人工生成模板難度較大、質量檢驗困難的問題。本申請通過第一預設數量的短文本對預設基礎模板組集合的交互檢驗實現了保證可控準確率前提下短文本語義理解處理泛化能力的提高,同時降低了整套語義理解模板生成方法的難度,加大了程序化作業,便于批量、在線、靈活、應急生成和/或優化更改語義理解模板。
為了實現上述目的,本申請提供了以下技術方案:
一種短文本語義理解模板檢驗方法,包括:
步驟E1:處理第1條待語義理解的短文本,對初步生成和/或優化過對應若干條規則模板的第1條待語義理解的短文本進行分類,轉存成已完成語義理解的短文本,同時存儲其與對應的若干個預設基礎語義組、及對應的若干條規則模板建立的正確匹配關系,所述正確匹配關系指某條短文本只會匹配中包含其語義的若干個預設基礎語義組對應的若干條規則模板,與預設基礎語義組集合中剩余預設基礎語義組對應的預設基礎模板組子集中任一條規則模板之間是不匹配的關系;
步驟E2:處理非第1條待語義理解的短文本,交互檢驗非第1條正在處理的待語義理解的短文本初步生成和/或優化過的若干條規則模板和現有的所有規則模板,交互檢驗通過后,對非第1條正在處理的待語義理解的短文本進行分類,轉存成已完成語義理解的短文本,同時存儲其與對應的若干個預設基礎語義組、及對應的若干條規則模板建立的正確匹配關系,所述交互檢驗指正在處理的某條待語義理解的短文本與對應若干個語義組及對應的若干條規則模板建立正確匹配關系,已完成語義理解的所有短文本分別與現有規則模板集合中對應的若干條規則模板建立正確匹配關系;
步驟E3:對待語義理解的短文本中的第2條到第一預設數量條,循環重復上面的步驟E2,實現每條待語義理解的短文本的分類過程中都使用交互檢驗,每條規則模板反復經過交互檢驗。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽迪科數金科技有限公司,未經安徽迪科數金科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011364644.0/2.html,轉載請聲明來源鉆瓜專利網。





