[發明專利]工單文本內容的分析方法、系統、設備以及存儲介質在審
| 申請號: | 202210408969.7 | 申請日: | 2022-04-19 |
| 公開(公告)號: | CN114676679A | 公開(公告)日: | 2022-06-28 |
| 發明(設計)人: | 張子墨;周航;宋志遠 | 申請(專利權)人: | 北京零點遠景網絡科技有限公司;北京零點有數數據科技股份有限公司 |
| 主分類號: | G06F40/205 | 分類號: | G06F40/205;G06F40/284;G06F16/35;G06Q40/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100020 北京市朝陽*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 內容 分析 方法 系統 設備 以及 存儲 介質 | ||
1.一種工單文本內容的分析方法,其特征在于,包括:
提取工單中的文本內容,對所述文本內容進行第一預處理;
基于訓練好的稅務場景分類模型,對第一預處理后的文本內容進行稅務場景分類,得到稅務場景種類;
基于訓練好的稅務訴求分類模型,對第一預處理后的文本內容進行稅務訴求分類,得到稅務訴求種類;
根據規則抽取方法,對所述工單進行要素抽取,得到要素種類。
2.根據權利要求1所述的方法,其特征在于,所述稅務場景分類模型的訓練方法,包括:
采集樣本,對所述樣本進行第二預處理;
設置損失函數和損失權重,基于第二預處理后的樣本、損失函數和損失權重對所述稅務場景分類模型進行訓練和優化。
3.根據權利要求1所述的方法,其特征在于,所述稅務訴求分類模型的訓練方法,包括:
采集樣本,對所述樣本進行第二預處理;
設置損失函數和損失權重,基于第二預處理后的樣本、損失函數和損失權重對所述稅務訴求分類模型進行訓練和優化。
4.根據權利要求1所述的方法,其特征在于,所述根據規則抽取方法,對所述工單進行要素抽取,得到要素種類,包括:
根據工單中的已有字段,在工單中抽取關鍵詞;
若沒有抽取到關鍵詞,則根據所述文本內容和構建的要素碼表,獲取關鍵詞;
判斷關鍵詞是否為俗稱;
若是,則將關鍵詞轉換為專業詞,所述專業詞為要素種類;
若否,則關鍵詞為要素種類。
5.根據權利要求1所述的方法,其特征在于,在所述基于訓練好的稅務場景分類模型,對第一預處理后的文本內容進行稅務場景分類,得到稅務場景種類之后,還包括:
根據所述文本內容和稅務場景種類,構建第一框架表。
6.根據權利要求1所述的方法,其特征在于,在所述基于訓練好的稅務訴求分類模型,對第一預處理后的文本內容進行稅務訴求分類,得到稅務訴求種類之后,還包括:
根據所述文本內容和稅務訴求種類,構建第二框架表。
7.根據權利要求1所述的方法,其特征在于,在所述根據規則抽取方法,對所述工單進行要素抽取,得到要素種類之后,還包括:
根據所述文本內容、稅務場景種類、稅務訴求種類和要素種類,構建第三框架表。
8.一種工單文本內容的分析系統,其特征在于,包括,
文本內容提取模塊,用于提取工單中的文本內容,對所述文本內容進行第一預處理;
稅務場景分類模塊,用于基于訓練好的稅務場景分類模型,對第一預處理后的文本內容進行稅務場景分類,得到稅務場景種類;
稅務訴求分類模塊,用于基于訓練好的稅務訴求分類模型,對第一預處理后的文本內容進行稅務訴求分類,得到稅務訴求種類;以及,
要素抽取模塊,用于根據規則抽取方法,對所述工單進行要素抽取,得到要素種類。
9.一種計算機設備,其特征在于,包括存儲器和處理器,所述存儲器上存儲有能夠被所述處理器加載并執行如權利要求1至7中任一種方法的計算機程序。
10.一種計算機可讀存儲介質,其特征在于,存儲有能夠被處理器加載并執行如權利要求1至7中任一種方法的計算機程序。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京零點遠景網絡科技有限公司;北京零點有數數據科技股份有限公司,未經北京零點遠景網絡科技有限公司;北京零點有數數據科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210408969.7/1.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





