[發明專利]輸入法智能性評測系統和方法有效
| 申請號: | 201110285633.8 | 申請日: | 2011-09-23 |
| 公開(公告)號: | CN103019924A | 公開(公告)日: | 2013-04-03 |
| 發明(設計)人: | 司天歌;曹菲;侯杰;周楊;肖鏡輝;劉廷超;楊洋;周曉波 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F11/36 | 分類號: | G06F11/36 |
| 代理公司: | 北京德琦知識產權代理有限公司 11018 | 代理人: | 閻敏;宋志強 |
| 地址: | 518044 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 輸入法 智能性 評測 系統 方法 | ||
技術領域
本發明涉及計算機輸入法技術領域,特別涉及一種輸入法智能性評測系統和方法。
背景技術
目前市場上輸入法種類繁多,成熟的商業輸入法功能全面,通常包含單字輸入、詞語輸入、整句輸入等多種輸入方式。其中,在整句輸入方式下,用戶的輸入思維能夠保持連貫,用戶能夠更加專注于輸入內容本身,而不是輸入過程。整句輸入方式成為當前用戶的主要輸入方式。輸入法在整句輸入方式下的性能表現,是輸入法智能性的直接體現。
對于一款輸入法軟件,如何評價輸入法的智能性呢?目前主要的評測方式為人工評測。即,在開發過程中,由開發人員根據自己的個人習慣和喜好,挑選待輸入的語句,用輸入法進行輸入,觀察輸入法給出的候選輸出是否符合預期,從而判斷輸入法的智能性高低。這種方法的局限性在于,評測人員以及評測用例的代表性有限——代表的是相同類型用戶的特定的輸入需求——使得測試結果的偏差較大。并且,評測人員對于輸入法的智能性只能夠給出模糊的評價,如:很好、好、還不錯、不好等等,這些評價不夠精確;在智能性沒有明顯提高或降低的情況下,這些評價的區分度也不大。還有一種評測方法,就是將輸入法發布,直接讓廣大輸入法用戶進行評測。但由于此時輸入法軟件產品已經發布,如果智能性較之前有所下降,則對廣大用戶來講是一種損害;并且當產品發布周期較長時,這種做法是對用戶的不負責任。
可見,現有的輸入法智能性評測方法均無法自動、客觀地評測輸入法軟件的智能性。
發明內容
本發明實施例提出一種輸入法智能性評測系統和方法,能夠自動、客觀地評價輸入法軟件的智能性水平。
本發明的技術方案是這樣實現的:
一種輸入法智能性評測系統,包括:
測試集采集裝置,用于采集測試集,將所述測試集提供給評測服務器;
所述評測服務器,用于利用所述測試集對所述輸入法軟件的智能性進行評測。
其中,上述測試集采集裝置包括:
網頁抓取器,用于抓取不同類別網頁的內容,生成網頁文本,將所述網頁文本發送至網頁文本過濾器;所述網頁的類別包括:聊天網頁、微博網頁、論壇網頁、博客網頁、搜索網頁或正式文檔網頁;
所述網頁文本過濾器,用于對所述網頁文本進行過濾,生成測試集,并將所述測試集提供給評測服務器。
評測服務器包括:
拼音標注工具,用于生成所述測試集中的原始文字所對應的拼音序列;
按鍵產生器,用于將所述拼音序列轉換為計算機按鍵的按鍵序列,并將所述按鍵序列輸入到所述輸入法軟件,產生文字輸出結果;
文本校對器,用于將所述測試集中的原始文字和所述文字輸出結果進行比對,得到所述輸入法軟件的智能性指標。
輸入法軟件的智能性指標為:句準確率、字準確率或測試集的迷惑度;其中,
所述句準確率等于所述比對結果一致的句子數與測試集中的句子數的商;
所述字準確率等于所述比對結果一致的文字數與測試集中的原始文字數的商;
測試集的迷惑度的計算方式為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110285633.8/2.html,轉載請聲明來源鉆瓜專利網。





