[發明專利]基于Rasa_Nlu框架提高實體識別率的方法、裝置、系統和存儲介質在審
| 申請號: | 201910923027.0 | 申請日: | 2019-09-27 |
| 公開(公告)號: | CN110704623A | 公開(公告)日: | 2020-01-17 |
| 發明(設計)人: | 馮海洪;毛德平;王康 | 申請(專利權)人: | 安徽咪鼠科技有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/36;G06F40/295 |
| 代理公司: | 53113 昆明合眾智信知識產權事務所 | 代理人: | 葉春娜 |
| 地址: | 230088 安徽省合肥市高新區習友路33*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 實體識別 模型訓練 語料 自然語言處理技術 預處理 人工智能領域 數據處理領域 存儲介質 輸入語音 意圖識別 數據集 分詞 構建 解析 場景 計算機 便利 | ||
本發明涉及數據處理領域,尤其涉及一種基于Rasa_Nlu框架提高實體識別率的方法、裝置、系統和存儲介質,該方法包括:首先,輸入語音并使用jieba分詞;然后獲取語料并進行預處理;接下來,進行MITIE模型訓練,采用MITIE中wordrep這一個工具進行模型訓練,得到數據集;最后,構建Rasa_Nlu語料和模型,用于進行意圖識別和實體識別,獲取用戶的意圖,本發明運用當下最新的人工智能領域的自然語言處理技術,能精確的解析用戶的意圖,并且本發明計算機場景下基于Rasa_Nlu框架的方法可以提高實體識別率,解決現行方法實體識別率低下的問題,為人們提供了很大的便利。
技術領域
本發明涉及數據處理領域,尤其涉及一種基于Rasa_Nlu框架提高實體識別率的方法、裝置、系統和存儲介質。
背景技術
自然語言處理(Nature Language Process)分為三個環節,其中大部分困難點都是出現在自然語言理解(Nature Language Understand)部分,主要問題是歧義問題和未知語言現象問題。一方面,自然語言中大量存在的歧義現象,無論在詞法層次、句法層次,還是在語義層次和語用層次,無論哪類語言單位,其歧義性始終都是困擾人們實現應用目標的一個根本問題。另一方面,對于一個特定系統來說,總是有可能遇到未知詞匯、未知結構等各種意想不到的情況,而且每一種語言又都隨著社會的發展而動態變化著,新的詞匯(尤其是一些新的人名、地名、組織機構名和專用詞匯)、新的詞義、新的詞匯用法(新詞類),甚至新的句子結構都在不斷出現,尤其在口語對話或計算機網絡對話(微博、博客等,稀奇古怪的詞語和話語結構更是司空見慣。
目前,市面上很多自然語言理解方法的實體識別率都特別低,所以我們將開發一種計算機場景下基于RasaNlu框架提高實體識別率的方法。
發明內容
針對上述存在的問題,本發明的目的是提供一種計算機場景下基于RasaNlu框架提高實體識別率的方法,解決現行方法實體識別率低下的問題,為了解決上述現有技術中存在的問題,本發明提供一種基于Rasa_Nlu框架提高實體識別率的方法,包括以下步驟:
步驟S1:語音輸入并使用jieba分詞;
步驟S2:語料獲取及預處理;
步驟S3:MITIE模型訓練,采用MITIE中wordrep這一個工具進行模型訓練,得到數據集;
步驟S4:構建Rasa_Nlu語料和模型,用于進行意圖識別和實體識別;
步驟S5:獲取用戶的意圖。
優選的,步驟S4中所述意圖識別是在句子級別進行分類,明確意圖;所述實體識別是在詞級別找出用戶問題中的關鍵實體,進行實體槽填充。
為達上述目的,本發明還提供一種基于Rasa_Nlu框架提高實體識別率的裝置,包括
信息輸入模塊,用于語音的輸入;
信息采集及預處理模塊,用于采集語音信息,并且進行預處理;
MITIE模型訓練模塊,用于模型訓練,得到數據集;
構建Rasa_Nlu語料和模型,用于進行意圖識別和實體識別;
獲取模塊,用于獲取用戶的意圖。
為達上述目的,本發明還提供一種基于Rasa_Nlu框架提高實體識別率的系統,包括存儲器,處理器以及存儲于存儲器上并可在處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現上述方法的步驟。
為達上述目的,本發明還提供一種計算機可讀存儲介質,其上存儲有計算機程序,所述程序被處理器執行時實現上述方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽咪鼠科技有限公司,未經安徽咪鼠科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910923027.0/2.html,轉載請聲明來源鉆瓜專利網。





