[發明專利]用于輸入法編輯器的瀏覽歷史語言模型在審
| 申請號: | 201280075563.6 | 申請日: | 2012-08-31 |
| 公開(公告)號: | CN104813257A | 公開(公告)日: | 2015-07-29 |
| 發明(設計)人: | M·李;X·陳 | 申請(專利權)人: | 微軟技術許可有限責任公司 |
| 主分類號: | G06F3/01 | 分類號: | G06F3/01 |
| 代理公司: | 上海專利商標事務所有限公司 31100 | 代理人: | 管琦琦 |
| 地址: | 美國華*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 輸入法 編輯器 瀏覽 歷史 語言 模型 | ||
1.一種方法,包括:
基于瀏覽歷史信息生成瀏覽歷史語言模型;以及
響應于經由輸入法編輯器界面接收到拉丁文字符串,至少部分地基于所述瀏覽歷史語言模型來預測非拉丁文字符串。
2.如權利要求1所述的方法,其特征在于,所述瀏覽歷史信息至少包括高速緩存的瀏覽內容。
3.如權利要求2所述的方法,其特征在于,所述瀏覽歷史信息進一步包括實時瀏覽內容。
4.如權利要求1所述的方法,其特征在于,所預測的非拉丁文字符串基于所述瀏覽歷史語言模型和通用語言模型來確定。
5.如權利要求4所述的方法,其特征在于,所述瀏覽歷史語言模型的貢獻基于加權因子確定。
6.如權利要求5所述的方法,其特征在于,所述加權因子包括默認加權因子或用戶定義的加權因子。
7.如權利要求1所述的方法,其特征在于,進一步包括經由所述輸入法編輯器界面呈現所預測的非拉丁文字符串。
8.如權利要求1所述的方法,其特征在于:
所述拉丁文字符串包括拼音字符串;以及
所預測的非拉丁文字符串包括中文字符串。
9.如權利要求1所述的方法,其特征在于:
多個非拉丁文字符串與經由所述輸入法編輯器界面接收到的拉丁文字符串相關聯;以及
轉換概率與所述多個非拉丁文字符串中的每個非拉丁文字符串相關聯。
10.如權利要求9所述的方法,其特征在于,預測所述非拉丁文字符串包括標識所述多個非拉丁文字符串中具有最高轉換概率的所述非拉丁文字符串。
11.如權利要求10所述的方法,其特征在于,通用語言模型將所述多個非拉丁文字符串中的第一非拉丁文字符串標識為具有所述最高轉換概率的所述非拉丁文字符串。
12.如權利要求11所述的方法,其特征在于,所述瀏覽歷史語言模型將所述多個非拉丁文字符串中的第二非拉丁文字符串標識為具有所述最高轉換概率的所述非拉丁文字符串。
13.如權利要求12所述的方法,其特征在于,由所述通用語言模型標識的所述第一非拉丁文字符串不同于由所述瀏覽歷史語言模型標識的所述第二非拉丁文字符串。
14.如權利要求1所述的方法,其特征在于,所述瀏覽歷史語言模型包括N-gram統計語言模型。
15.一種計算系統,包括:
一個或多個處理器;
一個或多個存儲指令的計算機可讀介質,當所述指令被一個或多個處理器執行時,致使所述一個或多個處理器以執行包括以下的動作:
基于瀏覽歷史信息生成瀏覽歷史語言模型;以及
響應于經由輸入法編輯器界面接收到拉丁文字符串,至少部分地基于所述瀏覽歷史語言模型來預測非拉丁文字符串。
16.如權利要求15所述的計算系統,其特征在于,所述動作還包括:
檢測新的瀏覽內容;以及
響應于檢測到新的瀏覽內容,處理所述新的瀏覽內容以更新所述瀏覽歷史語言模型。
17.如權利要求15所述的計算系統,其特征在于,所述動作還包括:
周期性地監視一個或多個瀏覽器高速緩存位置以確定新的瀏覽內容是否已經被保存到所述一個或多個瀏覽器高速緩存位置;以及
處理所述新的瀏覽內容以更新所述瀏覽歷史語言模型。
18.一個或多個維護指令的計算機可讀介質,當所述指令被一個或多個處理器執行時,配置所述一個或多個處理器以執行包括以下的動作:
基于瀏覽歷史信息生成瀏覽歷史語言模型;以及
響應于經由輸入法編輯器界面接收到拉丁文字符串:
基于在通用語言模型的基礎上確定的第一轉換概率和在所述瀏覽歷史語言模型的基礎上確定的第二轉換概率來確定多個非拉丁文字符串中每個非拉丁文字符串的總轉換概率,其中所述第二轉換概率對所述總轉換概率的貢獻基于加權因子加權;
基于所述總轉換概率對所述多個非拉丁文字符串排序;以及
經由所述輸入法編輯器界面顯示非拉丁文字符串的經排序的列表。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微軟技術許可有限責任公司,未經微軟技術許可有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201280075563.6/1.html,轉載請聲明來源鉆瓜專利網。





