[發明專利]基于搜索引擎的數據處理方法、裝置、電子設備及介質在審
| 申請號: | 202211441185.0 | 申請日: | 2022-11-17 |
| 公開(公告)號: | CN115730123A | 公開(公告)日: | 2023-03-03 |
| 發明(設計)人: | 劉振;陳卓 | 申請(專利權)人: | 中國平安人壽保險股份有限公司 |
| 主分類號: | G06F16/953 | 分類號: | G06F16/953;G06F40/30;G06F18/23;G06F17/18;G06F16/9535 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 黃英杰 |
| 地址: | 518000 廣東省深圳市福田區福田街道益田路5033號平安*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 搜索引擎 數據處理 方法 裝置 電子設備 介質 | ||
本申請實施例提供了一種基于搜索引擎的數據處理方法、裝置、電子設備及介質,屬于數據處理技術領域。該方法包括:基于搜索引擎獲取多個用戶的用戶信息,其中,用戶信息包括用戶的詢問信息以及詢問信息的發生時間;根據預設時間規則以及發生時間對詢問信息進行劃分,得到多個詢問集合;對詢問集合進行語義空間計算,得到詢問集合的矯正傾向值;根據預設漂移值對矯正傾向值進行篩選,得到目標矯正傾向值;根據目標矯正傾向值對搜索引擎進行調整。本申請實施例能夠在預設時間內有選擇地對用戶的詢問語句中的語義進行分析,提高數據分析的效率。
技術領域
本申請涉及數據處理技術領域,尤其涉及一種基于搜索引擎的數據處理方法、裝置、電子設備及介質。
背景技術
隨著互聯網的發展,基于搜索引擎的數據處理逐漸成為數據處理領域的重要研究分支,其中,最常見的基于搜索引擎的數據處理方法為通過用戶搜出的列表進行分析,即,通過用戶點擊搜索列表的先后順序、點擊次數以及當下熱詞推薦等方法進行分析,需要跟蹤分析大量信息,導致數據處理效率較低,為了解決這一問題,目前,還有一種“用戶矯正問句行為捕獲”的方法,通過捕捉“用戶在較短時間內下發多次語義接近的問句”行為來進行數據分析,由于用戶有可能對搜索結果列表不滿意,因此用戶嘗試通過更換同語義的問句來矯正輸入,但是在進行行為捕獲的方法過程中,經常出現單位時間段不明確、無法確定多個問句的語義信息等情況,從而導致數據分析數據量巨大,分析數據效率低的問題。
發明內容
本申請實施例的主要目的在于提出一種基于搜索引擎的數據處理方法、裝置、電子設備及介質,能夠在預設時間內有選擇地對用戶的詢問語句中的語義進行分析,提高數據分析的效率。
為實現上述目的,本申請實施例的第一方面提出了一種基于搜索引擎的數據處理方法,所述方法包括:
基于搜索引擎獲取多個用戶的用戶信息,其中,所述用戶信息包括用戶的詢問信息以及所述詢問信息的發生時間;
根據預設時間規則以及所述發生時間對所述詢問信息進行劃分,得到多個詢問集合;
對所述詢問集合進行語義空間計算,得到所述詢問集合的矯正傾向值;
根據預設漂移值對所述矯正傾向值進行篩選,得到目標矯正傾向值;
根據所述目標矯正傾向值對所述搜索引擎進行調整。
在一些實施例,所述預設擴散模型包括文本前端模塊,所述根據預設時間規則以及所述發生時間對所述詢問信息進行劃分,得到多個詢問集合,包括:
根據所述發生時間對所述詢問信息進行排序,得到發生時間序列;
根據所述預設時間規則對所述發生時間序列進行劃分,得到多個時間區間;
對所述時間區間內的全部所述詢問信息進行統計,得到多個所述詢問集合。
在一些實施例,所述詢問集合包括多個語義向量;所述對所述詢問集合進行語義空間計算,得到所述詢問集合的矯正傾向值,包括:
獲取所述詢問集合中的多個語義向量;
基于預設距離函數對所述語義向量進行計算,得到所述語義向量的距離參數;
根據聚類分析算法對所述距離參數進行平均計算,得到語義空間值;
根據所述語義空間值以及所述語義向量的數量得到所述詢問集合的矯正傾向值。
在一些實施例,所述根據預設漂移值對所述矯正傾向值進行篩選,得到目標矯正傾向值,包括:
根據所述矯正傾向值以及所述發生時間生成傾向曲線;
根據所述預設漂移值對所述傾向曲線進行劃分,得到與所述矯正傾向值對應的矯正閾值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國平安人壽保險股份有限公司,未經中國平安人壽保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211441185.0/2.html,轉載請聲明來源鉆瓜專利網。





