[發明專利]一種基于政務工單的突發事件檢測方法有效
| 申請號: | 202210063986.1 | 申請日: | 2022-01-20 |
| 公開(公告)號: | CN114372458B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 鄭文博;湯灝;包利安 | 申請(專利權)人: | 北京零點遠景網絡科技有限公司;北京零點有數數據科技股份有限公司 |
| 主分類號: | G06F18/214 | 分類號: | G06F18/214;G06F18/21;G06F40/216;G06F40/289;G06Q50/26;G06N5/04;G06N3/09 |
| 代理公司: | 北京維正專利代理有限公司 11508 | 代理人: | 李傳亮 |
| 地址: | 100020 北京市朝陽*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 政務 突發事件 檢測 方法 | ||
1.一種突發事件模型的訓練方法,其特征在于,包括:
獲取訓練樣本,所述訓練樣本包括正樣本和負樣本,其中,所述正樣?本為帶有已打好標簽的突發事件的文本數據,所述負樣本為帶有非突發事?件的文本數據;
以所述正樣本和負樣本為輸入,以所有突發事件的概率值為輸出,對?突發事件模型進行訓練,獲得訓練好的所述突發事件模型;
還包括:
將訓練好的所述突發事件模型通過損失函數進行優化,獲得優化后的?所述突發事件模型;
所述將訓練好的所述突發事件模型通過損失函數進行優化包括:
將訓練好的突發事件模型基于預訓練Bert模型構建多標簽場景損失函?數,來進行finetuning訓練;
其中,所述損失函數能夠針對多標簽的樣本數據進行建模;采用如下?損失函數,作為優化目標:
其中,所述N為負樣本集合,所述P為正樣本集合,所述S?i為正樣本?得分,所述S?j為負樣本得分;
在所述獲取訓練樣本之后,還包括:
先利用Bert預處理模型中的分詞器BasicTokenizer對所述訓練樣本進?行分詞,得到一個token列表,對每個token進行一次WordpieceTokenizer?處理,得到最終的分詞結果;然后對分詞后的每個詞的開頭連接[CLS]標記;?再將分詞后的每個詞用基于所述Bert預訓練模型的特征向量表示,對每個?句子進行embedding向量化表示,對每個詞的相對位置編碼向量表示,再將?三種特征向量相加,得到能夠輸入所述突發事件模型的特征向量。
2.根據權利要求1所述的訓練方法,其特征在于,還包括:
獲取驗證集,利用驗證集對優化后的所述突發事件模型進行驗證。
3.一種突發事件模型的訓練裝置,其特征在于,包括:
獲取模塊,用于獲取訓練樣本,所述訓練樣本包括正樣本和負樣本,?其中,所述正樣本為帶有已打好標簽的突發事件的文本數據,所述負樣本?為帶有非突發事件的文本數據;
訓練模塊,用于以所述正樣本和負樣本為輸入,以所有突發事件的概?率值為輸出,對突發事件模型進行訓練,獲得訓練好的所述突發事件模型;
還包括:
優化模塊,用于將訓練好的所述突發事件模型通過損失函數進行優化,?獲得優化后的所述突發事件模型;
所述優化模塊,具體用于將訓練好的突發事件模型基于預訓練Bert模?型構建多標簽場景損失函數,來進行finetuning訓練;其中,所述損失函數?能夠針對多標簽的樣本數據進行建模;采用如下損失函數,作為優化目標:
其中,所述N為負樣本集合,所述P為正樣本集合,所述S?i為正樣本?得分,所述S?j為負樣本得分;
預處理模塊,用于先利用Bert預處理模型中的分詞器BasicTokenizer?對所述訓練樣本進行分詞,得到一個token列表,對每個token進行一次?WordpieceTokenizer處理,得到最終的分詞結果;然后對分詞后的每個詞的?開頭連接[CLS]標記;再將分詞后的每個詞用基于所述Bert預訓練模型的特?征向量表示,對每個句子進行embedding向量化表示,對每個詞的相對位置?編碼向量表示,再將三種特征向量相加,得到能夠輸入所述突發事件模型的特征向量。
4.根據權利要求3所述的訓練裝置,其特征在于,還包括:
驗證模塊,用于獲取驗證集,利用驗證集對優化后的所述突發事件模?型進行驗證。
5.一種基于政務工單的突發事件檢測方法,其特征在于,包括:
獲取政務工單;
將所述政務工單輸入至如權利要求1或者2所述的訓練好的突發事件?模型,獲得所述政務工單中的突發事件。
6.根據權利要求5所述的突發事件檢測方法,其特征在于,所述獲得?所述政務工單中的突發事件包括:
利用所述突發事件模型計算出所有突發事件的概率值,取所述概率值?最大的突發事件作為最終要獲得的突發事件。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京零點遠景網絡科技有限公司;北京零點有數數據科技股份有限公司,未經北京零點遠景網絡科技有限公司;北京零點有數數據科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210063986.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種畫板自動布紙器
- 下一篇:一種輪式運輸車車胎間隙內大塊硬物的自助清除方法





