[發(fā)明專利]一種生成輸入法候選項的方法及電子裝置有效
| 申請?zhí)枺?/td> | 201210532165.4 | 申請日: | 2012-12-11 |
| 公開(公告)號: | CN103870001B | 公開(公告)日: | 2018-07-10 |
| 發(fā)明(設(shè)計)人: | 吳先超;陳曉昕 | 申請(專利權(quán))人: | 百度國際科技(深圳)有限公司 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023;G06F17/30 |
| 代理公司: | 北京鴻德海業(yè)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11412 | 代理人: | 袁媛 |
| 地址: | 518057 廣東省深圳市南山*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 候選項 輸入信息 輸入法 排序 電子裝置 時間語言 用戶體驗 時間段 推送 集合 展示 | ||
1.一種生成輸入法候選項的方法,其特征在于,包括:
接收當前用戶在當前時段的輸入信息;
根據(jù)已建立的按領(lǐng)域及時間先后順序進行劃分的多個不同領(lǐng)域及不同先前時段下的領(lǐng)域-時間語言模型,獲取所述當前用戶在當前時段的輸入信息所對應(yīng)的候選項集合中每個候選項在各所述領(lǐng)域-時間語言模型中的第一權(quán)值;
根據(jù)每個所述候選項的所述第一權(quán)值獲取每個候選項在每一領(lǐng)域的多個先前時段下的第一累積權(quán)值,其中,所述第一累積權(quán)值為每一領(lǐng)域的多個先前時段下的所述第一權(quán)值的加權(quán)求和,且所述第一權(quán)值對所述第一累積權(quán)值的貢獻度隨時間先后順序逐步消減;
基于每個所述候選項的所述第一累積權(quán)值,對所述輸入信息的候選項進行排序,包括:
根據(jù)包括當前用戶在內(nèi)的多個用戶在所述多個先前時段的輸入歷史信息獲取每個用戶在各領(lǐng)域和先前時段下針對每個候選項的第二權(quán)值;
根據(jù)所述第二權(quán)值獲取每個用戶在每一領(lǐng)域的多個先前時段下針對每個候選項的第二累積權(quán)值,其中,所述第二累積權(quán)值是每個用戶在每一領(lǐng)域的多個先前時段下的第二權(quán)值的加權(quán)求和,所述第二權(quán)值對所述第二累積權(quán)值的貢獻度隨時間先后順序逐步消減;
基于每個候選項在每一領(lǐng)域下的所述第一累積權(quán)值和所述第二累積權(quán)值獲取每個候選項在全部領(lǐng)域下的第三累積權(quán)值,并根據(jù)所述第三累積權(quán)值的大小對所述輸入信息的候選項進行排序,其中,所述第三累積權(quán)值是基于時間、領(lǐng)域以及用戶的貢獻程度,當前用戶在當前時段對候選項的累積的權(quán)值;
展示進行所述排序后的候選項。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,接收當前用戶在當前時段的輸入信息的步驟之前,還包括:
使用文本分類技術(shù),對網(wǎng)頁語料進行分類整理,獲得按領(lǐng)域進行劃分的網(wǎng)頁語料;
對所述按領(lǐng)域進行劃分的網(wǎng)頁語料再按時間先后順序進行分類整理,獲得按領(lǐng)域及時間先后順序進行劃分的網(wǎng)頁語料;
基于每一所述按領(lǐng)域及時間先后順序進行劃分的網(wǎng)頁語料,分別訓練出一所述領(lǐng)域-時間語言模型。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)每個所述候選項的所述第一權(quán)值獲取每個候選項在每一領(lǐng)域的多個先前時段下的第一累積權(quán)值的步驟包括:
通過如下公式獲取所述第一累積權(quán)值:
其中,C(w,l,t)為候選項w在領(lǐng)域l下的當前時段t的第一累積權(quán)值,ti為第i個先前時段,numi·w為候選項w在領(lǐng)域l的第i個先前時段下的領(lǐng)域-時間語言模型下的出現(xiàn)頻次,作為所述第一權(quán)值,n為所述先前時段的數(shù)量,λ為消減系數(shù)。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于每個候選項的所述第一累積權(quán)值,對所述輸入信息的候選項進行排序的步驟包括:
按照所述第一累積權(quán)值的大小對所述候選項進行排序。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)包括當前用戶在內(nèi)的多個用戶的輸入歷史信息獲取每個用戶在各領(lǐng)域和先前時段下針對每個候選項的第二權(quán)值的步驟包括:
對每個用戶的輸入歷史信息,按照領(lǐng)域進行分類,對所述按照領(lǐng)域進行分類后的輸入歷史信息按時間先后順序進行分類整理,獲得多個不同領(lǐng)域及先前時段的不同領(lǐng)域下的輸入歷史信息;
統(tǒng)計每個用戶在每個領(lǐng)域及先前時段輸入所述輸入信息時對每個候選項的選擇次數(shù),作為第二權(quán)值。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述根據(jù)所述第二權(quán)值獲取每個用戶在每一領(lǐng)域的多個先前時段下針對每個候選項的第二累積權(quán)值的步驟包括:
通過如下公式獲取第二累積權(quán)值:
其中,t表示當前時段,tj為第j個先前時段,n為所述先前時段的數(shù)量,Eu(w,l,t)為第u個用戶在當前時段t針對領(lǐng)域l下的候選項w的第二累積權(quán)值,sj為第u個用戶在第j個先前時段輸入所述輸入信息時對候選項w的選擇次數(shù),λ為消減常數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度國際科技(深圳)有限公司,未經(jīng)百度國際科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210532165.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字數(shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計算機能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機傳送到輸出設(shè)備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計算機之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出





