[發明專利]意圖識別數據處理系統有效
| 申請號: | 202110934400.X | 申請日: | 2021-08-16 |
| 公開(公告)號: | CN113377969B | 公開(公告)日: | 2021-11-09 |
| 發明(設計)人: | 籍焱;薄滿輝;唐紅武;王殿勝;張麗穎;譚智隆;高棟 | 申請(專利權)人: | 中航信移動科技有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/35;G06F16/33;G06F40/242;G06F40/279 |
| 代理公司: | 北京鍾維聯合知識產權代理有限公司 11579 | 代理人: | 丁慧玲 |
| 地址: | 100041 北京市石景山*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 意圖 識別 數據處理系統 | ||
本發明涉及一種意圖識別數據處理系統,實現:步驟S1、獲取用戶query,并進行預處理,得到用戶query的第一分詞列表{Q1,Q2,…QM},其中,M為用戶query分詞數量,Qi為第i個分詞,初始化i=1,執行步驟S2;步驟S2、基于Qi檢索知識圖譜,判斷是否存在對應標簽信息,若存在,則設置Qi’=Qi+預設分隔符+Ti+預設分隔符,其中,Ti為Qi對應的標簽信息,否則,設置Qi’=Qi;步驟S3、判斷i是否小于M,若是,則設置i=i+1,返回執行步驟S2,否則,基于所有Qi’生成第二分詞列表{Q1’,Q2’,…QM’};步驟S4、將{Q1’,Q2’,…QM’}轉換為輸入向量,輸入所述意圖分類模型中,生成意圖識別結果。本發明提高了意圖識別準確度。
技術領域
本發明涉及計算機技術領域,尤其涉及一種意圖識別數據處理系統。
背景技術
隨著人工智能的快速發展,意圖識別在很多應用場景中尤為重要,例如語音識別、智能問答等應用場景。現有的意圖識別技術主要基于閑聊等場景,但對于垂直領域的意圖體系并不完善。以民航領域為例,現有的機場、航空公司的意圖識別主要從客服沿用的知識庫抽象而來,語料有限,且意圖之間重疊、混淆的情況時有發生,無法實現意圖界限分明、場景覆蓋全面。部分現有技術的意圖識別主要基于規則,缺乏靈活性,僅當用戶輸入的問題能夠命中關鍵規則的時候,系統才能給到用戶準確的意圖識別結果,而用戶的問題存在多樣性、表述不規范及存在錯別字等特點。此時,基于規則的方法則也很難準確識別用戶意圖。此外,現有的意圖識別技術還缺乏對垂直領域基礎知識的融合,以民航領域為例,民航業有很多專業性的詞匯,包括航司名稱、機場名稱及簡稱、別名;甚至包括對于航班動態的掌握,目前的意圖識別系統對于這些背景信息及民航知識圖譜信息的融入很少,因此意圖識別準確度低。由此可知,如何提高意圖識別準確度成為亟待解決的技術問題。
發明內容
本發明目的在于,提供一種意圖識別數據處理系統,提高了意圖識別準確度。
根據本發明一方面,提供了一種意圖識別數據處理系統,包括基于預設的垂直領域信息構建的知識圖譜、意圖分類模型,存儲有計算機程序的存儲器和處理器,當所述處理器在執行所述計算機程序時,實現以下步驟:
步驟S1、獲取用戶query,并對所述用戶query進行預處理,得到用戶query的第一分詞列表{Q1,Q2,…QM},M為用戶query分詞數量,Qi為第i個分詞,i的取值為1到M,初始化i=1,執行步驟S2;
步驟S2、基于Qi檢索所述知識圖譜,判斷是否存在對應標簽信息,若存在,則設置Qi’=Qi+預設分隔符+Ti+預設分隔符,其中,Ti為Qi對應的標簽信息,否則,設置Qi’=Qi;
步驟S3、判斷i是否小于M,若是,則設置i=i+1,返回執行步驟S2,否則,基于所有Qi’生成第二分詞列表{ Q1’,Q2’,…QM’};
步驟S4、將{ Q1’,Q2’,…QM’}轉換為輸入向量,將所述輸入向量輸入所述意圖分類模型中,生成意圖識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中航信移動科技有限公司,未經中航信移動科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110934400.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:多輪智能問答數據處理系統
- 下一篇:一種基于生產數據的文本生成系統





