[發明專利]一種信息處理方法及電子設備有效
| 申請號: | 201410299742.9 | 申請日: | 2014-06-26 |
| 公開(公告)號: | CN105446977B | 公開(公告)日: | 2019-03-29 |
| 發明(設計)人: | 葛付江;苗振興;賈鵬程;趙凱;卓雷 | 申請(專利權)人: | 聯想(北京)有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36 |
| 代理公司: | 北京金信知識產權代理有限公司 11225 | 代理人: | 黃威;王智 |
| 地址: | 100085 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 信息處理 方法 電子設備 | ||
本發明涉及計算機領域,公開了一種信息處理方法及電子設備,以解決現有技術中對特定用戶群體的群體特征詞匯更新速度慢的技術問題,該方法應用于電子設備中,包括:獲得電子設備的用戶的N個特征詞匯,N為正整數;判斷N個特征詞匯中的任一特征詞匯是否為用戶所在特定用戶群體的群體特征詞匯,進而從N個特征詞匯中確定出M個群體特征詞匯,其中,群體特征詞匯為特定用戶群體中的至少兩個用戶的特征詞匯,M為小于等于N的正整數;通過M個群體特征詞匯對電子設備的用戶詞典進行更新。
技術領域
本發明涉及計算機領域,特別涉及一種信息處理方法及電子設備。
背景技術
隨著科學技術的不斷發展,電子技術也得到了飛速的發展,電子產品的種類也越來越多,人們也享受到了科技發展帶來的各種便利。現在人們可以通過各種類型的電子設備,享受隨著科技發展帶來的舒適生活。
而在電子設備的應用中,漢字輸入法已經成為用戶與電子設備交互的重要手段,漢字輸入法技術需要將用戶的一連串鍵盤按鍵翻譯成用戶想要的漢字串,通常漢字輸入法都需要具備用戶詞典,用于存儲用戶最可能會使用的漢字、詞語和短語,而通常情況下,特定用戶群體中多個用戶可能會有相同的特征詞匯,該詞即為群體特征詞匯,現有技術中都需要通過服務器來確定特定用戶群體的群體特征詞匯,例如:服務器端從互聯網上收集整理,然后下發給輸入法客戶端;又例如:服務器端收集輸入法客戶端用戶的輸入詞匯及其詞頻然后進行統計,再下發給輸入法客戶端等等。然而,這兩種方式都需要服務器端通過較長的周期收集整理用戶的特征詞匯,故而現有技術中存在著對特定用戶群體的群體特征詞匯更新速度慢的技術問題。
發明內容
本發明實施例提供一種信息處理方法及電子設備,以解決現有技術中對特定用戶群體的群體特征詞匯更新速度慢的技術問題。
第一方面,本發明實施例提供一種信息處理方法,應用于電子設備中,包括:獲得所述電子設備的用戶的N個特征詞匯,N為正整數;判斷所述N個特征詞匯中的任一特征詞匯是否為所述用戶所在特定用戶群體的群體特征詞匯,進而從所述N個特征詞匯中確定出M個群體特征詞匯,其中,所述群體特征詞匯為所述特定用戶群體中的至少兩個用戶的特征詞匯,M為小于等于N的正整數;通過所述M個群體特征詞匯對所述電子設備的用戶詞典進行更新。
結合第一方面,在第一種可能的實現方式中,所述判斷所述特征詞匯中的任一特征詞匯是否為所述用戶所在特定用戶群體的群體特征詞匯,具體包括:依次取i為1至N的整數,確定所述N個特征詞匯中第i個特征詞匯的第i傳播跳數和第i共現跳數,所述第i傳播跳數具體為:所述第i個特征詞匯從第一次出現到傳輸至所述電子設備所經過的節點數量,所述第i共現跳數具體為:在所述第i個特征詞匯的傳播過程中,將所述第i個特征詞匯作為特征詞匯的節點數量;判斷所述第i共現跳數除以所述第i傳播跳數的商值是否大于第一預設閾值;在所述商值大于所述第一預設閾值時,則確定所述第i個特征詞匯為所述群體特征詞匯。
結合第一方面,在第二種可能的實現方式中,所述獲得所述電子設備的用戶的N個特征詞匯,具體為:獲得所述電子設備的用戶使用頻率超過第二預設閾值的詞匯作為所述N個特征詞匯;或接收另一電子設備發送至所述N個特征詞匯;或獲得所述電子設備的用戶的使用頻率超過第二預設閾值的N1個詞匯,以及接收另一電子設備的發送至的N2個特征詞匯,所述N1個詞匯與所述N2個特征詞匯組成所述N個特征詞匯。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于聯想(北京)有限公司,未經聯想(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410299742.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于生成數據格式描述語言模型的方法和裝置
- 下一篇:一種自適應的分詞方法





