[發明專利]跨平臺稅務智能客服語料遷移方法及裝置在審
| 申請號: | 202011131586.7 | 申請日: | 2020-10-21 |
| 公開(公告)號: | CN112418875A | 公開(公告)日: | 2021-02-26 |
| 發明(設計)人: | 王芳;劉振宇;張天颯;林文輝;王志剛;楊碩;馬誼駿 | 申請(專利權)人: | 航天信息股份有限公司 |
| 主分類號: | G06Q30/00 | 分類號: | G06Q30/00;G06Q40/00;G06F16/332 |
| 代理公司: | 北京工信聯合知識產權代理有限公司 11266 | 代理人: | 姜麗輝 |
| 地址: | 100195 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 平臺 稅務 智能 客服 語料 遷移 方法 裝置 | ||
1.一種跨平臺稅務智能客服語料遷移方法,其特征在于,包括:
利用預先構建的目標平臺的語料模型,對原有平臺的源語料庫去重,得到標準問題及相似問題;
從原有平臺的源語料庫中,分別提取與各標準問題對應的答案;
按照語料模型對應的樣式模板組織各標準問題對應的格式數據,得到適用于目標平臺的目標語料庫;
將適用于目標平臺的目標語料庫遷移到目標平臺,以使得目標平臺利用目標語料庫生成智能客服用知識庫。
2.根據權利要求1所述的方法,其特征在于,
所述預先構建的目標平臺的語料模型中,以標準問題為索引,
所述標準問題對應的格式數據包括:標準問題、類別標記、關聯問題、相似問題及答案;
其中,標準問題是對應有標準答案的問題,在目標語料庫內,各標準問題相互不重復;
關聯問題是從業務流程上,與標準問題對應的向上延伸問題或向下延伸問題,該關聯問題對應有標準答案;
相似問題是與標準問題的問法不同,但語義相似、且可以用同一個答案來回答的問題;
答案是分別對應于標準問題、關聯問題及相似問題的標準答案。
3.根據權利要求2所述的方法,其特征在于,
所述按照語料模型對應的樣式模板組織各標準問題對應的格式數據,包括;
在所述樣式模板中,將標準問題作為當前的問題,占一個內容格;
向標準問題附加其對應的類別標記,所述類別標記占一個內容格;
向標準問題附加其對應的各相似問題,每一個相似問題占一個內容格;
向標準問題附加其對應的關聯問題,每一個關聯問題占一個內容格;
向標準問題附加其對應的標準答案,所述標準答案占一個內容格。
4.根據權利要求3所述的方法,其特征在于,
所述利用預先構建的目標平臺的語料模型,對原有平臺的源語料庫去重,得到標準問題,包括:
從待遷移的原有平臺的源語料庫中,根據預先設定的類別標記及標準問題,篩選出與任一標準問題語義相同的多個問題,并保留其中一個問題作為標準問題保留,將其他問題刪除。
5.根據權利要求4所述的方法,其特征在于,
所述利用預先構建的目標平臺的語料模型,對原有平臺的源語料庫去重,得到相似問題,包括:
從待遷移的原有平臺的源語料庫中,根據預先設定的類別標記及標準問題,篩選出與任一標準問題語義相似的多個問題,保留其中一個問題作為標準問題,將其他問題標記為該標準問題的相似問題。
6.根據權利要求5所述的方法,其特征在于,
所述按照語料模型對應的樣式模板組織各標準問題對應的格式數據,得到適用于目標平臺的目標語料庫,包括:
所述目標平臺的目標語料庫為word文檔的形式;
在獲取到答案中的文本后,將該文本寫入到目標word語料文檔中;
在提取到答案中的網址后,以超鏈接的形式將該網址寫入到目標word語料文檔中;
在獲取到答案中的圖片在本地或服務器的存儲地址后,下載圖片并將下載的圖片插入到目標word語料文檔中;
在獲取到答案中圖片對應的超鏈接地址后,下載圖片并將下載的圖片插入到目標word語料文檔中;
在目標word語料文檔中,所述答案中的文本、圖片和網址保留在源語料庫中的先后順序。
7.根據權利要求6所述的方法,其特征在于,
所述將適用于目標平臺的目標語料庫遷移到目標平臺,以使得目標平臺利用目標語料庫生成智能客服用知識庫,包括:
將所述目標word語料文檔上傳到目標平臺的智能客服的后臺,所述后臺在訓練智能客服的過程中,生成由目標平臺的智能客服使用的知識庫;所述目標平臺的智能客服利用所述知識庫提供稅務智能客戶服務。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于航天信息股份有限公司,未經航天信息股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011131586.7/1.html,轉載請聲明來源鉆瓜專利網。





