[發明專利]離線語義識別調整方法、裝置、設備及存儲介質有效
| 申請號: | 201910292315.0 | 申請日: | 2019-04-12 |
| 公開(公告)號: | CN109977420B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 孟振南 | 申請(專利權)人: | 出門問問創新科技有限公司;大眾汽車(中國)投資有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/289;G06F40/242;G06F16/35 |
| 代理公司: | 北京鼎承知識產權代理有限公司 11551 | 代理人: | 夏華棟;顧可嘉 |
| 地址: | 210034 江蘇省南京市*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 離線 語義 識別 調整 方法 裝置 設備 存儲 介質 | ||
1.一種離線語義識別調整方法,其特征在于,包括:
對領域分類模型、意圖分類模型及語義槽識別模型進行訓練;
根據相應領域的領域詞典進行分詞調整;以及
根據調整后的分詞的擴展分類特征來相對于所述相應領域來調整領域分類模型、意圖分類模型及語義槽識別模型;根據調整后的分詞與基于規則的正則表達式的匹配結果作為擴展特征,根據所述擴展特征及所述擴展分類特征來調整領域分類模型和意圖分類模型;通過所述擴展特征及所述擴展分類特征對所述領域分類模型進行領域化調整,并將調整后的模型部署到離線環境。
2.如權利要求1所述的方法,其特征在于,還包括:定制基于規則的正則表達式,其中根據領域的常見句式及表達習慣來定制基于規則的正則表達式。
3.如權利要求1至2中任一項所述的方法,其特征在于,基于調整后的分詞與正則表達式的匹配結果來生成擴展后的分類特征,基于所述擴展后的分類特征來對領域分類模型和意圖分類模型進行調整。
4.如權利要求1至3中任一項所述的方法,其特征在于,還包括:為相應領域定制領域詞典,并且相對于所述相應領域,根據定制的領域詞典進行分詞調整。
5.如權利要求1至4中任一項所述的方法,其特征在于,當離線語義識別模型用于其它領域的離線語義識別時,通過更換至與其它領域相關的領域詞典,根據更換后的領域詞典進行分詞調整;以及根據調整后的分詞的擴展分類特征來調整領域分類模型、意圖分類模型及語義槽識別模型,以適用于所述其它領域。
6.如權利要求1至5中任一項所述的方法,其特征在于,所述領域詞典存儲于設備終端,并且基于存儲在設備終端的領域詞典進行分詞調整。
7.一種離線語義識別調整裝置,其特征在于,包括:
訓練模塊,對領域分類模型、意圖分類模型及語義槽識別模型進行訓練;
分詞調整模型,根據領域詞典進行分詞調整;以及
擴展調整模塊,根據調整后的分詞的擴展分類特征來調整領域分類模型、意圖分類模型及語義槽識別模型;根據調整后的分詞與基于規則的正則表達式的匹配結果作為擴展特征,根據所述擴展特征及所述擴展分類特征來調整領域分類模型和意圖分類模型;通過所述擴展特征及所述擴展分類特征對所述領域分類模型進行領域化調整,并將調整后的模型部署到離線環境。
8.一種電子設備,其特征在于,包括:
存儲器,所述存儲器存儲執行指令;以及
處理器,所述處理器執行所述存儲器存儲的執行指令,使得所述處理器執行如權利要求1至6中任一項所述的方法。
9.一種可讀存儲介質,其特征在于,所述可讀存儲介質中存儲有執行指令,所述執行指令被處理器執行時用于實現如權利要求1至6中任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于出門問問創新科技有限公司;大眾汽車(中國)投資有限公司,未經出門問問創新科技有限公司;大眾汽車(中國)投資有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910292315.0/1.html,轉載請聲明來源鉆瓜專利網。





