[發明專利]字符數量的統計方法、裝置、設備及存儲介質有效

申請號：	201910825315.2	申請日：	2019-08-30
公開（公告）號：	CN110705256B	公開（公告）日：	2023-03-21
發明（設計）人：	魏佳	申請（專利權）人：	平安科技（深圳）有限公司
主分類號：	G06F40/216	分類號：	G06F40/216;G06F16/903
代理公司：	深圳市世紀恒程知識產權代理事務所 44287	代理人：	胡海國
地址：	518000 廣東省深圳市福田區福***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	字符數量統計方法裝置設備存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種字符數量的統計方法，其特征在于，所述方法包括以下步驟：

監測用戶終端界面中文本輸入框內的字符的變化情況；

在所述文本輸入框內的字符發生變化時，統計所述文本輸入框內的字符的數量，得到初始字符數量統計值；

基于預設的正則表達式，篩選并統計所述文本輸入框內所有與預設多表情字符庫中的預設表情字符匹配的字符，獲得多字符表情數量，所述預設表情字符為由多個字符進行表征的表情字符，所述預設多表情字符庫涵蓋了所述文本輸入框支持輸入的所有多字符表情；

根據所述初始字符數量統計值和多字符表情數量，確定所述文本輸入框內的實際字符數量；

所述基于預設的正則表達式，篩選并統計所述文本輸入框內所有與預設多表情字符庫中的預設表情字符匹配的字符，獲得多字符表情數量的步驟之前，所述方法還包括：

獲取樣本數據，并對所述樣本數據進行數據清洗，得到目標樣本數據；

采用留出法對所述目標樣本數據進行劃分，得到訓練數據和測試數據，所述訓練數據和所述測試數據互斥；

采用卷積神經網絡算法，構建訓練模型；

對所述訓練數據進行標記，并將標記后的訓練數據作為輸入參數，輸入到所述訓練模型中進行處理，獲得訓練結果；

判斷所述訓練結果是否與標記后的所述訓練數據對應的標記結果匹配；

若匹配，則將輸出所述訓練結果的訓練模型確定為初始分析模型；若不匹配，則繼續使用標記后的所述訓練數據對所述訓練模型進行訓練，直到輸出的訓練結果與標記結果匹配；

對所述測試數據進行標記，并將標記后的所述測試數據作為輸入參數，輸入到所述初始分析模型中進行處理，獲得驗證結果；

判斷所述驗證結果是否與標記后的所述測試數據對應的標記結果匹配，若匹配，則將所述初始分析模型確定為目標分析模型；

所述對所述樣本數據進行數據清洗包括去除殘缺數據、去除錯誤數據、去除重復數據和格式轉換；

所述確定所述文本輸入框內的實際字符數量的步驟之后，所述方法還包括：

將所述實際字符數量與預設字符數量閾值做比較，若所述實際字符數量不大于所述字符數量閾值，則將所述字符數量閾值與所述實際字符數量做減法運算，得到剩余可輸入字符數量統計值，并將所述剩余可輸入字符數量統計值顯示在所述用戶終端界面上；

在接收到所述用戶觸發的消息提交指令時，獲取所述文本輸入框內的所有字符，得到待提交文本；

獲取所述用戶的用戶信息，根據所述用戶信息確定所述待提交文本對應的存儲區塊，并獲取所述存儲區塊對應的區塊編號；

根據預先建立的映射關系表和所述區塊編號，確定所述存儲區塊對應的原始密鑰，所述映射關系表為所述區塊編號與所述原始密鑰之間的對應關系；

獲取所述原始密鑰對應的原始密鑰向量，采用同態加密算法對所述原始密鑰向量進行加密獲得同態加密向量；

采用哈希密鑰算法對所述同態加密向量中的隨機數進行加密獲得哈希結果；

采用對稱加密算法對所述同態加密向量中的密文數據進行加密獲得對稱加密結果；

對所述哈希結果和所述對稱加密結果進行異或運算，生成目標密鑰；

對所述待提交文本進行遍歷，利用所述目標密鑰對當前字符對應的統一碼進行加密，得到所述當前字符對應的密文數據；

記錄各個所述當前字符對應的密文數據，得到加密文本，并將所述加密文本存儲到所述存儲區塊中；

對所述文本輸入框支持的表情字符庫進行遍歷，獲取并記錄當前表情字符對應的統一碼，得到初始待分析數據；

從所述初始待分析數據中過濾出所述預設表情字符對應的統一碼，得到目標待分析數據；

將所述目標待分析數據作為輸入參數，輸入預先構建的目標分析模型，得到第一分析結果和第二分析結果，所述第一分析結果為所述預設表情字符對應的統一碼中取值相同的統一碼取值，所述第二分析結果為所述預設表情字符對應的統一碼中取值不同的統一碼取值區間；

獲取預設的正則表達式模板，所述正則表達式模板包括開頭部分、固定部分、第一匹配部分和第二匹配部分；

將所述第一分析結果輸入到所述正則表達式模板的第一匹配部分，將所述第二分析結果輸入到所述正則表達式模板的第二匹配部分，得到所述正則表達式；

所述基于預設的正則表達式，篩選并統計所述文本輸入框內所有與預設多表情字符庫中的預設表情字符匹配的字符，獲得多字符表情數量的步驟，包括：

對所述文本輸入框內的字符進行遍歷，獲取當前字符對應的統一碼，并確定所述統一碼對應的長度；

判斷所述統一碼對應的長度是否大于預設位數；

若所述統一碼對應的長度大于預設位數，則提取所述統一碼的前預設位數部分，得到第一識別部分，將剩余的統一碼部分作為第二識別部分；

將所述第一識別部分與所述正則表達式中的第一匹配部分進行匹配，若所述第一識別部分與所述第一匹配部分匹配，遍歷所述正則表達式中第二匹配部分的統一碼取值區間，并將第二匹配部分的統一碼取值與所述第二識別部分進行匹配，若所述第二識別部分與第二匹配部分的統一碼取值匹配，則確定當前字符為所述預設表情字符；

累計所述預設表情字符的數量，獲得多字符表情數量。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于平安科技（深圳）有限公司，未經平安科技（深圳）有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201910825315.2/1.html，轉載請聲明來源鉆瓜專利網。

上一篇：檢測語句之間的關聯關系的方法和裝置
下一篇：媒體資源的識別方法、裝置、存儲介質及電子裝置

同類專利

專利分類

G 物理

G06 計算；推算；計數
G06F 電數字數據處理

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】