[發明專利]輸入法智能性評測系統和方法有效
| 申請號: | 201110285633.8 | 申請日: | 2011-09-23 |
| 公開(公告)號: | CN103019924A | 公開(公告)日: | 2013-04-03 |
| 發明(設計)人: | 司天歌;曹菲;侯杰;周楊;肖鏡輝;劉廷超;楊洋;周曉波 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F11/36 | 分類號: | G06F11/36 |
| 代理公司: | 北京德琦知識產權代理有限公司 11018 | 代理人: | 閻敏;宋志強 |
| 地址: | 518044 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 輸入法 智能性 評測 系統 方法 | ||
1.一種輸入法智能性評測系統,用于評測預先選定的輸入法軟件的智能性,其特征在于,所述系統包括:
測試集采集裝置,用于采集測試集,將所述測試集提供給評測服務器;
所述評測服務器,用于利用所述測試集對所述輸入法軟件的智能性進行評測。
2.根據權利要求1所述的系統,其特征在于,所述測試集采集裝置包括:
網頁抓取器,用于抓取不同類別網頁的內容,生成網頁文本,將所述網頁文本發送至網頁文本過濾器;所述網頁的類別包括:聊天網頁、微博網頁、論壇網頁、博客網頁、搜索網頁或正式文檔網頁;
所述網頁文本過濾器,用于對所述網頁文本進行過濾,生成測試集,并將所述測試集提供給評測服務器。
3.根據權利要求1所述的系統,其特征在于,所述評測服務器包括:
拼音標注工具,用于生成所述測試集中的原始文字所對應的拼音序列;
按鍵產生器,用于將所述拼音序列轉換為計算機按鍵的按鍵序列,并將所述按鍵序列輸入到所述輸入法軟件,產生文字輸出結果;
文本校對器,用于將所述測試集中的原始文字和所述文字輸出結果進行比對,得到所述輸入法軟件的智能性指標。
4.根據權利要求3所述的系統,其特征在于,所述輸入法軟件的智能性指標為:句準確率、字準確率或測試集的迷惑度;其中,
所述句準確率等于所述比對結果一致的句子數與測試集中的句子數的商;
所述字準確率等于所述比對結果一致的文字數與測試集中的原始文字數的商;
測試集的迷惑度的計算方式為:
其中,S為包含NW個詞的測試集,
PP(S)為測試集S的迷惑度,
Wi為測試集S中的第i個詞,
n為預先設定的整數。
5.根據權利要求1至4任意一項所述的系統,其特征在于,所述系統還包括:
代碼管理服務器,用于接收并保存外界輸入的輸入法軟件代碼,所述輸入法軟件代碼是根據所述輸入法軟件的智能性評測結果生成的;
輸入法資源生成裝置,用于生成優化詞典和優化語言模型;
自動編譯機,用于根據所述輸入法軟件代碼、優化詞典和優化語言模型生成優化的輸入法軟件,將所述優化的輸入法軟件輸入評測服務器,供評測服務器對其智能性進行評測。
6.一種輸入法智能性評測方法,應用權利要求1所述的系統評測預先選定的輸入法軟件的智能性,其特征在于,所述方法包括:
測試集采集裝置采集測試集,將所述測試集提供給評測服務器;所述評測服務器利用所述測試集對所述輸入法軟件的智能性進行評測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110285633.8/1.html,轉載請聲明來源鉆瓜專利網。





