[發明專利]一種意圖分析方法及系統在審
| 申請號: | 202011180059.5 | 申請日: | 2020-10-29 |
| 公開(公告)號: | CN112487802A | 公開(公告)日: | 2021-03-12 |
| 發明(設計)人: | 石忠民;林劍周;鐘力 | 申請(專利權)人: | 廣州索答信息科技有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/117;G06F40/211;G06K9/62;G10L15/26 |
| 代理公司: | 廣州市越秀區哲力專利商標事務所(普通合伙) 44288 | 代理人: | 曾令軍 |
| 地址: | 510530 廣東省廣州市高新技術*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 意圖 分析 方法 系統 | ||
本發明公開了一種意圖分析方法及系統,其詞性標注模型根據領域詞訓練得到的,可將新的相關詞更新至參考詞句數據庫并與相關的領域詞關聯,使詞性標注模型能夠快速適應新詞匯,快速響應服務需求;還可根據不同領域的領域詞訓練得到若干領域的詞性標注模型,對不同領域的領域表達句式和參考表達句式分別進行比對,得到匹配度最高的參考表達句式作為意圖判定結果,從而有效避免了歧義詞導致的意圖誤識別,提高意圖判斷準確率。
技術領域
本發明屬于意圖識別技術領域,尤其涉及一種意圖分析方法及系統。
背景技術
人工智能正在逐步深入人們的日常生活,自然語言處理在這其中更是扮演著舉足輕重的角色。如何快速理解用戶的意圖并提供對應的產品服務對企業發展至關重要。
目前,為了提高對用戶意圖的理解效率,需不斷地訓練大量龐大而復雜的模型,面對生活中變化多樣的詞匯,模型需要重新學習新詞匯,導致模型的訓練時間長且維護成本高;同時,用戶的語言表達中難免會出現歧義詞,這容易導致意圖識別錯誤。
發明內容
為了克服現有技術的不足,本發明的目的在于提供一種意圖分析方法及系統,以解決目前的意圖識別模型無法快速適應新詞匯且對于歧義詞容易誤識別的問題。
本發明的目的采用如下技術方案實現:
一種意圖分析方法,包括:
建立參考詞句數據庫,所述參考詞句數據庫包括領域詞、與所述領域詞相關聯的相關詞以及具有意圖標記的參考表達句式;
根據所述領域詞訓練得到其所屬領域的詞性標注模型;
獲取用戶輸入的語言信息,對所述語言信息進行分詞,并基于若干個所述詞性標注模型分別標注所述語言信息中的所述領域詞,得到若干個領域表達句式;
將每個所述領域表達句式與其同一領域的所述參考表達句式進行比對,比對匹配度最高的所述參考表達句式作為意圖判定結果,并基于所述意圖判定結果的所述參考表達句式得到所述意圖標記。
進一步地,所述建立參考詞句數據庫的步驟包括:
獲取所述領域詞,根據所述領域詞獲取與其關聯的所述相關詞。
進一步地,所述建立參考詞句數據庫的步驟還包括:
在若干領域獲取對應的領域表達句型;
將所述領域表達句型中出現的所述相關詞替換為與所述相關詞關聯的所述領域詞,得到所述參考表達句式。
進一步地,在所述將所述領域表達句型中出現的所述相關詞替換為與所述相關詞關聯的所述領域詞,得到所述參考表達句式步驟之后,還包括:
根據所述參考表達句式所需提供的服務,對所述參考表達句式添加所述意圖標記。
進一步地,所述根據領域詞訓練得到其所屬領域的詞性標注模型步驟還包括:
根據所述領域詞和所述領域表達句型生成基礎語料,利用所述基礎語料訓練得到所述詞性標注模型。
進一步地,所述基于所述詞性標注模型標注所述語言信息中的所述領域詞步驟還包括:
所述詞性標注模型識別其所屬領域的相關詞并標注為對應的所述領域詞。
進一步地,所述基于所述詞性標注模型標注所述語言信息中的所述領域詞步驟還包括:
將新的所述相關詞關聯至與其相關的所述領域詞,所述詞性標注模型對所述語言信息中出現的新的所述相關詞進行識別并標注為所述領域詞。
進一步地,篩選出與所述領域表達句式處于同一領域且匹配度最高的所述參考表達句式,并基于所述參考表達句式得到所述意圖標記步驟之后,還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州索答信息科技有限公司,未經廣州索答信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011180059.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種防藥液晃蕩的無人機藥箱
- 下一篇:一種新生兒科用奶瓶清洗裝置





