[發明專利]話單數據處理方法、電子設備及計算機可讀存儲介質在審
| 申請號: | 201811583902.7 | 申請日: | 2018-12-24 |
| 公開(公告)號: | CN111432080A | 公開(公告)日: | 2020-07-17 |
| 發明(設計)人: | 張勇攀;吳景壯;周楠 | 申請(專利權)人: | 北京奇虎科技有限公司 |
| 主分類號: | H04M3/436 | 分類號: | H04M3/436;G06F40/30 |
| 代理公司: | 北京市立方律師事務所 11330 | 代理人: | 張筱寧 |
| 地址: | 100088 北京市西城區新*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據處理 方法 電子設備 計算機 可讀 存儲 介質 | ||
本申請涉及應用軟件技術領域,特別是涉及一種話單數據處理方法、電子設備及計算機可讀存儲介質,該話單數據處理方法包括:獲取待處理的電話號碼對應的各類型信令數據;對各類型信令數據進行特定處理后,基于特定處理結果構建所述電話號碼對應的待處理的話單數據;提取所述待處理的話單數據對應的特征信息;基于預設的數據識別模型對所述特征信息進行識別,得到對應的識別結果,所述識別結果用于表征話單數據是否為特定類型的數據。本申請提供的上述處理,實現了對騷擾電話的有效識別,基于數據識別模型的引入,保證了識別準確率。
技術領域
本申請涉及應用軟件技術領域,特別是涉及一種話單數據處理方法、電子設備及計算機可讀存儲介質。
背景技術
隨著科技的飛速發展,基于電話的溝通方式已經成為了人們生活中不可或缺的聯系方式。
雖然基于電話的溝通方式方便了我們的生活,但隨之而來的是大量的騷擾電話如廣告推銷電話、冒充銀行工作人員的詐騙電話以及故意電話騷擾等,給我們生活帶來了很多負面的影響,影響了人們的正常生活。當然,現有技術中在對騷擾電話進行識別時,通常是由用戶主動進行識別,并基于用戶的識別進行對應的騷擾標記,這種方式雖然可以識別出騷擾電話,但并不能保證識別的準確性,且效率較低。因此,在保證對騷擾電話的識別準確性基礎上,如何有效地識別出騷擾電話成為了當前亟待解決的技術問題。
發明內容
本申請提供了一種話單數據處理方法、電子設備及計算機可讀存儲介質,以在保證對騷擾電話的識別準確性基礎上,實現對騷擾電話的有效識別。
第一方面,提供了一種話單數據處理方法,包括:
獲取待處理的電話號碼對應的各類型信令數據;
對各類型信令數據進行特定處理后,基于特定處理結果構建所述電話號碼對應的待處理的話單數據;
提取所述待處理的話單數據對應的特征信息;
基于預設的數據識別模型對所述特征信息進行識別,得到對應的識別結果,所述識別結果用于表征話單數據是否為特定類型的數據。
在一個可能地實現方式中,所述特定處理包括如下至少一項:
對各類型信令數據的去重處理;
對各類型信令數據的整理處理。
在一個可能地實現方式中,所述話單數據用于表征每個電話號碼對應的特定通話特征信息,
所述特定通話特征信息包括如下至少一項:
主被叫通話占比;
主被叫通話的離散度。
在一個可能地實現方式中,所述提取所述待處理的話單數據對應的特征信息,包括:
對所述待處理的話單數據進行語義識別,得到對應的語義特征信息。
在一個可能地實現方式中,基于預設的數據識別模型對所述特征信息進行識別之前,還包括:
獲取樣本數據;所述樣本數據包括待訓練的話單數據及其對應的標識信息,所述標識信息用于表征待訓練的話單數據為特定類型的數據;
提取所述樣本數據對應的語義特征信息;
基于所述樣本數據的語義特征信息進行模型訓練,得到所述數據識別模型。
在一個可能地實現方式中,還包括:
當滿足預設條件時,對所述數據識別模型的樣本數據進行更新;
其中,所述對所述數據識別模型的樣本數據進行更新,包括:
獲取用于更新的待處理的話單數據;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇虎科技有限公司,未經北京奇虎科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811583902.7/2.html,轉載請聲明來源鉆瓜專利網。





