[發(fā)明專利]一種數(shù)據(jù)處理方法、裝置、設(shè)備和介質(zhì)在審
| 申請?zhí)枺?/td> | 201810637434.0 | 申請日: | 2018-06-20 |
| 公開(公告)號: | CN108874175A | 公開(公告)日: | 2018-11-23 |
| 發(fā)明(設(shè)計)人: | 孟可豐;賀亮;馬鳴 | 申請(專利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 詞語 詞庫 上屏 數(shù)據(jù)處理 時間段 裝置設(shè)備 衰減 信息檢索技術(shù) 干擾用戶 權(quán)重 計算機 更新 管理 | ||
1.一種數(shù)據(jù)處理方法,其特征在于,包括:
根據(jù)詞庫中每個詞語在所述詞語的上屏?xí)r間段內(nèi)的詞庫上屏次數(shù),確定所述詞語的衰減比例,其中所述上屏?xí)r間段是所述詞語的最近至少一次的上屏?xí)r間與所述詞庫的最近一次的上屏?xí)r間之間的時間段;
根據(jù)所述詞語的衰減比例對所述詞庫中各詞語的權(quán)重進行更新。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)詞庫中每個詞語在所述詞語的上屏?xí)r間段內(nèi)的詞庫上屏次數(shù),確定所述詞語的衰減比例包括:
根據(jù)詞庫中每個詞語最近至少兩次的上屏?xí)r間確定詞語的最近上屏?xí)r間;
根據(jù)上屏?xí)r間段內(nèi)的詞庫上屏次數(shù)確定所述詞語的衰減比例,其中所述上屏?xí)r間段是所述詞語的最近上屏?xí)r間與所述詞庫的最近一次的上屏?xí)r間之間的時間段。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)詞庫中每個詞語在所述詞語的上屏?xí)r間段內(nèi)的詞庫上屏次數(shù),確定所述詞語的衰減比例包括:
根據(jù)詞庫中每個詞語在所述詞語的上屏?xí)r間段內(nèi)的詞庫上屏次數(shù),和詞庫中每個詞語最近至少一次的上屏?xí)r間與當前時間之間的時間長度,確定所述詞語的衰減比例。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,在根據(jù)詞庫中每個詞語在所述詞語的上屏?xí)r間段內(nèi)的詞庫上屏次數(shù)確定所述詞語的衰減比例之前,還包括:
若詞庫中詞語上屏的總次數(shù)大于設(shè)定上屏次數(shù)閾值,則獲取詞庫中每個詞語在所述詞語的上屏?xí)r間段內(nèi)的詞庫上屏次數(shù)。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,在根據(jù)所述詞語的衰減比例對所述詞庫中各詞語的權(quán)重進行更新之后,還包括:
若衰減后詞語的權(quán)重小于設(shè)定清除權(quán)重閾值,則將所述詞語從詞庫中刪除。
6.根據(jù)權(quán)利要求1-5中任一權(quán)利要求所述的方法,其特征在于,還包括:
根據(jù)候選詞序列中的候選詞在所述候選詞的上屏?xí)r間段內(nèi)的詞庫上屏次數(shù)對所述候選詞的權(quán)重進行衰減;
根據(jù)衰減后的權(quán)重確定所述候選詞在候選詞序列中的排序。
7.一種數(shù)據(jù)處理裝置,其特征在于,包括:
衰減比例確定模塊,用于根據(jù)詞庫中每個詞語在所述詞語的上屏?xí)r間段內(nèi)的詞庫上屏次數(shù)確定所述詞語的衰減比例,其中所述上屏?xí)r間段是所述詞語的最近至少一次的上屏?xí)r間與所述詞庫的最近一次的上屏?xí)r間之間的時間段;
權(quán)重更新模塊,用于根據(jù)所述詞語的衰減比例對所述詞庫中各詞語的權(quán)重進行更新。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,衰減比例確定模塊包括:
上屏?xí)r間確定單元,用于根據(jù)詞庫中每個詞語最近至少兩次的上屏?xí)r間確定詞語的最近上屏?xí)r間;
衰減比例確定單元,用于根據(jù)上屏?xí)r間段內(nèi)的詞庫上屏次數(shù)確定所述詞語的衰減比例,其中所述上屏?xí)r間段是所述詞語的最近上屏?xí)r間與所述詞庫的最近一次的上屏?xí)r間之間的時間段。
9.根據(jù)權(quán)利要求7所述的裝置,其特征在于,衰減比例確定模塊包括:
結(jié)合時間衰減單元,用于根據(jù)詞庫中每個詞語在所述詞語的上屏?xí)r間段內(nèi)的詞庫上屏次數(shù),和詞庫中每個詞語最近至少一次的上屏?xí)r間與當前時間之間的時間長度,確定所述詞語的衰減比例。
10.根據(jù)權(quán)利要求7所述的裝置,其特征在于,還包括:
觸發(fā)條件判斷模塊,用于在根據(jù)詞庫中每個詞語在所述詞語的上屏?xí)r間段內(nèi)的詞庫上屏次數(shù)確定所述詞語的衰減比例之前,若詞庫中詞語上屏的總次數(shù)大于設(shè)定上屏次數(shù)閾值,則獲取詞庫中每個詞語在所述詞語的上屏?xí)r間段內(nèi)的詞庫上屏次數(shù)。
11.根據(jù)權(quán)利要求7所述的裝置,其特征在于,還包括:
詞語清理模塊,用于在根據(jù)所述詞語的衰減比例對所述詞庫中各詞語的權(quán)重進行更新之后,若衰減后詞語的權(quán)重小于設(shè)定清除權(quán)重閾值,則將所述詞語從詞庫中刪除。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810637434.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字數(shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計算機能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機傳送到輸出設(shè)備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計算機之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出
- 數(shù)據(jù)處理設(shè)備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設(shè)備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計算機可讀取的記錄介質(zhì)
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序





