[發明專利]短文本語義理解模板生成方法、語義理解處理方法及裝置在審
| 申請號: | 202011359958.1 | 申請日: | 2020-11-27 |
| 公開(公告)號: | CN112395885A | 公開(公告)日: | 2021-02-23 |
| 發明(設計)人: | 李曉霞 | 申請(專利權)人: | 安徽迪科數金科技有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/211;G06F16/33;G06F16/35 |
| 代理公司: | 北京科迪生專利代理有限責任公司 11251 | 代理人: | 張乾楨 |
| 地址: | 230088 安徽省合肥市*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 語義 理解 模板 生成 方法 處理 裝置 | ||
一種短文本語義理解模板生成方法、語義理解處理方法及裝置,所述方法包括:步驟S1收集第一預設數量的待語義理解的短文本;步驟S2根據第一預設數量的待語義理解的短文本生成預設基礎語義組集合;步驟S3基于第一預設數量的待語義理解的短文本生成和/或優化規則模板集合,進一步生成和/或優化預設基礎語義組集合對應的匹配模板集合;步驟S4所述匹配模板集合結合優先級生成預設基礎語義組集合對應的預設基礎模板組集合。本申請通過將待語義理解的短文本所含語義劃分成互不包含的語義組,結合優先級和匹配模板,實現對人端口語化的自然語言表述的待語義理解的短文本的理解處理,包括短文本多種意圖、局部語義與整體語義不一致、語音識別導致部分字錯誤的處理。
技術領域
本申請涉及自然語言語義理解領域,尤其涉及一種短文本語義理解模板生成方法、語義理解處理方法及裝置。
背景技術
通過對人類自然語言的識別、理解、表達進行的人機智能交互給人們的生活帶來了極大便利,隨著語音識別準確率及泛化能力的不斷提高,人機智能交互逐漸應用于各種產品中,并被大眾熟悉。其中影響推廣應用和大眾體驗的關鍵技術之一是對自然語言經語音識別后的短文本的理解。
目前短文本理解方法大致分為基于匹配模板和基于機器學習模型的方法。前者多為關鍵詞提取、(分詞后)同義合并,abnf文法。現有的方法流程繁瑣、冗余難于管理,難以平衡準確率和匹配率,處理不了相對復雜的語義的分類,比如,局部語義與整體語義不一致、實際交互場景中人端口語化而非嚴格書面語言的表達、實際交互場景中不同語義寬窄的需求。基于機器學習模型的方法需要先有大量實際場景互動數據,耗時去標注,專業研發人員去訓練,才能得到達到一定準確率的模型,啟動成本昂貴,小型或者非專業企業很難使用,進一步導致沒辦法產生實際場景互動數據。
發明內容
本申請提供了一種短文本語義理解模板生成方法、語義理解處理方法及裝置,目的在于解決缺少實際生產數據情況下,現有技術中,短文本語義理解準確率不夠高、和業務融合困難,不足以支撐實際生產使用的問題。
為了實現上述目的,本申請提供了以下技術方案:
一種短文本語義理解模板生成方法,包括:
步驟S1:收集第一預設數量的待語義理解的短文本;
步驟S2:根據第一預設數量的待語義理解的短文本生成預設基礎語義組集合,所述預設基礎語義組集合由相互之間不存在包含或被包含關系的若干預設基礎語義組組成;
步驟S3:基于第一預設數量的待語義理解的短文本生成和/或優化規則模板集合,進一步生成和/或優化預設基礎語義組集合對應的匹配模板集合,所述規則模板包括多個正則模板組件,是進行短文本語義理解匹配處理的最小單元;所述正則模板組件包括正則表達式、標點組合和關鍵字符,限定在規則模板的指定位置使用;所述匹配模板分為正式類和輔助類,各類別由若干對應的規則模板組成;
步驟S4:所述匹配模板集合結合優先級生成預設基礎語義組集合對應的預設基礎模板組集合。
上述方案中,所述步驟S2根據第一預設數量的待語義理解的短文本生成預設基礎語義組集合,包括:
步驟S21:生成語義庫,所述語義庫由第一預設數量條待語義理解的短文本中所有的不重復的最小語義單元組成;所述最小語義單元指最小數量子句組合的語義;所述子句指中文標點連接文本內容再連接中文標點;所述最小數量子句組合指自然語言表述中小于最小數量的子句組合的語義不能被理解,從而不能被合理響應,達到對應最小數量的子句組合的語義能夠被理解并響應;
步驟S22:根據業務或領域預設的響應范圍對應的語義分類,將語義庫中的最小語義單元分類到若干個具有預定語義寬度的預設基礎語義組中,生成預設基礎語義組集合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽迪科數金科技有限公司,未經安徽迪科數金科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011359958.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種中高熱流條件下防熱前緣柵格舵
- 下一篇:一種將普通開關轉化為點開關的裝置





