[發明專利]話單數據處理方法、電子設備及計算機可讀存儲介質在審
| 申請號: | 201811583902.7 | 申請日: | 2018-12-24 |
| 公開(公告)號: | CN111432080A | 公開(公告)日: | 2020-07-17 |
| 發明(設計)人: | 張勇攀;吳景壯;周楠 | 申請(專利權)人: | 北京奇虎科技有限公司 |
| 主分類號: | H04M3/436 | 分類號: | H04M3/436;G06F40/30 |
| 代理公司: | 北京市立方律師事務所 11330 | 代理人: | 張筱寧 |
| 地址: | 100088 北京市西城區新*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據處理 方法 電子設備 計算機 可讀 存儲 介質 | ||
1.一種話單數據處理方法,其特征在于,包括:
獲取待處理的電話號碼對應的各類型信令數據;
對各類型信令數據進行特定處理后,基于特定處理結果構建所述電話號碼對應的待處理的話單數據;
提取所述待處理的話單數據對應的特征信息;
基于預設的數據識別模型對所述特征信息進行識別,得到對應的識別結果,所述識別結果用于表征話單數據是否為特定類型的數據。
2.如權利要求1所述的方法,其特征在于,所述特定處理包括如下至少一項:
對各類型信令數據的去重處理;
對各類型信令數據的整理處理。
3.如權利要求1或2所述的方法,其特征在于,所述話單數據用于表征每個電話號碼對應的特定通話特征信息,
所述特定通話特征信息包括如下至少一項:
主被叫通話占比;
主被叫通話的離散度。
4.如權利要求1-3中任一項所述的方法,其特征在于,所述提取所述待處理的話單數據對應的特征信息,包括:
對所述待處理的話單數據進行語義識別,得到對應的語義特征信息。
5.如權利要求1-4中任一項所述的方法,其特征在于,基于預設的數據識別模型對所述特征信息進行識別之前,還包括:
獲取樣本數據;所述樣本數據包括待訓練的話單數據及其對應的標識信息,所述標識信息用于表征待訓練的話單數據為特定類型的數據;
提取所述樣本數據對應的語義特征信息;
基于所述樣本數據的語義特征信息進行模型訓練,得到所述數據識別模型。
6.如權利要求5所述的方法,其特征在于,還包括:
當滿足預設條件時,對所述數據識別模型的樣本數據進行更新;
其中,所述對所述數據識別模型的樣本數據進行更新,包括:
獲取用于更新的待處理的話單數據;
基于用于更新的待處理的話單數據對所述數據識別模型中的樣本數據進行在線更新。
7.如權利要求6所述的方法,其特征在于,所述預設條件包括如下任一項:
所述識別結果與實際結果為不同的結果;
所述識別結果與實際結果為不同結果的次數滿足預設閾值;
預設時間段。
8.一種話單數據處理裝置,其特征在于,包括:
獲取單元,用于獲取待處理的電話號碼對應的各類型信令數據;
處理單元,用于對各類型信令數據進行特定處理后,基于特定處理結果構建所述電話號碼對應的待處理的話單數據;
提取單元,用于提取所述待處理的話單數據對應的特征信息;
識別單元,用于基于預設的數據識別模型對所述特征信息進行識別,得到對應的識別結果,所述識別結果用于表征話單數據是否為特定類型的數據。
9.一種電子設備,其特征在于,包括:處理器和存儲器;
所述存儲器,用于存儲操作指令;
所述處理器,用于通過調用所述操作指令,執行上述權利要求1至權利要求7中任一項所述的話單數據處理方法。
10.一種計算機可讀存儲介質,其特征在于,所述計算機存儲介質用于存儲計算機指令,當其在計算機上運行時,使得計算機執行上述權利要求1至權利要求7中任一項所述的話單數據處理方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇虎科技有限公司,未經北京奇虎科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811583902.7/1.html,轉載請聲明來源鉆瓜專利網。





