[發明專利]用于識別問題類別的方法、裝置、電子設備及存儲介質在審
| 申請號: | 202010841416.1 | 申請日: | 2020-08-20 |
| 公開(公告)號: | CN112131380A | 公開(公告)日: | 2020-12-25 |
| 發明(設計)人: | 彭濤 | 申請(專利權)人: | 彭濤 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/279;G06Q50/26 |
| 代理公司: | 北京植德律師事務所 11780 | 代理人: | 唐華東 |
| 地址: | 100021 北京市朝陽區清河*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 識別 問題 類別 方法 裝置 電子設備 存儲 介質 | ||
1.一種用于識別問題類別的方法,包括:
獲取待識別政務熱線文本;
將所述待識別政務熱線文本切分成詞序列,基于所述詞序列生成所述待識別政務熱線文本對應的文本向量;
將所述待識別政務熱線文本對應的文本向量輸入預設問題類別集合中的每個問題類別對應的問題類別識別模型,得到所述預設問題類別集合中的每個問題類別對應的問題類別識別模型的識別結果,其中,各所述問題類別識別模型是基于深度學習模型訓練得到的;
基于各問題類別識別模型的識別結果,確定所述待識別政務熱線文本對應的問題類別集合。
2.根據權利要求1所述的方法,其中,所述預設問題類別集合中各個問題類別對應的問題類別識別模型是通過如下訓練步驟預先訓練得到的:
獲取樣本集,其中,所述樣本集中的樣本包括歷史政務熱線文本對應的文本向量和該歷史政務熱線文本所屬于的標注問題類別集合;
對于所述預設問題類別集合中的每個預設問題類別,執行以下識別模型訓練操作:用所述樣本集的各樣本中標注問題類別集合包括該預設問題類別的樣本中的文本向量生成與該預設問題類別對應的正樣本集合,以及用所述樣本集的各樣本中標注問題類別集合不包括該預設問題類別的樣本中的文本向量生成與該預設問題類別對應的負樣本集合;基于該預設問題類別對應的正樣本集合和負樣本集合,訓練初始深度學習模型得到該預設問題類別對應的問題類別識別模型。
3.根據權利要求1所述的方法,其中,所述基于各問題類別識別模型的識別結果,確定所述待識別政務熱線文本對應的問題類別集合,包括:
根據所述預設問題類別集合中的每個問題類別對應的問題類別識別模型的識別結果,確定所述待識別政務熱線文本是否屬于該問題類別;
將預設問題類別集合中所述待識別政務熱線文本所屬于的問題類別確定為所述待識別政務熱線文本的對應的問題類別集合。
4.根據權利要求1所述的方法,其中,所述獲取待識別政務熱線文本,包括:
獲取待識別政務熱線通話錄音;
對所述待識別政務熱線通話錄音進行語音識別,得到所述待識別政務熱線文本。
5.根據權利要求1所述的方法,其中,所述方法還包括:
將基于所述待識別政務熱線文本生成的電子工單分派至所述待識別政務熱線文本對應的問題類別集合中每個問題類別對應的職能部門。
6.根據權利要求1-5中任一項所述的方法,其中,所述方法還包括:
從所述待識別政務熱線文本對應的問題類別集合中每個問題類別對應的咨詢數據庫中確定所述待識別政務熱線文本對應的咨詢回復信息,其中,所述預設問題類別集合中每個問題類別對應的咨詢數據庫用于表征該預設問題類別對應的政務熱線文本與對應的咨詢回復信息之間的對應關系。
7.一種用于識別問題類別的裝置,包括:
獲取單元,被配置成獲取待識別政務熱線文本;
生成單元,被配置成將所述待識別政務熱線文本切分成詞序列,基于所述詞序列生成所述待識別政務熱線文本對應的文本向量;
識別單元,被配置成將所述待識別政務熱線文本對應的文本向量輸入預設問題類別集合中的每個問題類別對應的問題類別識別模型,得到所述預設問題類別集合中的每個問題類別對應的問題類別識別模型的識別結果,其中,各所述問題類別識別模型是基于深度學習模型訓練得到的;
確定單元,被配置成基于各問題類別識別模型的識別結果,確定所述待識別政務熱線文本對應的問題類別集合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于彭濤,未經彭濤許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010841416.1/1.html,轉載請聲明來源鉆瓜專利網。





