[發明專利]詞檢測和域字典推薦有效
| 申請號: | 201380044316.4 | 申請日: | 2013-08-19 |
| 公開(公告)號: | CN104584003B | 公開(公告)日: | 2017-08-11 |
| 發明(設計)人: | H·孫;C-H·李;J·李 | 申請(專利權)人: | 微軟技術許可有限責任公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 永新專利商標代理有限公司72002 | 代理人: | 王英 |
| 地址: | 美國華*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 檢測 字典 推薦 | ||
背景技術
隨著因特網功能性、信息轉移以及電子文檔生產和使用方面的劇增,越來越多的新詞正被創建并在用戶之間傳播,且越來越多的詞正被用于與各種不同域字典相關聯的電子文檔創建和使用中。
當從例如因特網網頁、電子郵件消息、文本消息、電子文檔等一個或多個源接收到新詞時,這些詞可能不被識別為屬于某一給定域字典,例如與字處理應用相關聯的域字典,且因此諸如文本輸入法、拼寫檢查、語法檢查、自動輸入完成等之類的功能性可能不能用于那些新詞。對于諸如由不是按空格或其他分界或分隔指示符劃分成詞的字符串組成的中文之類的復雜語言來說,這可能尤其是有問題的。
此外,通常用戶可能正在通過與某一給定域字典(例如標準英語、中文或其他標準語言域字典)相關聯的一給定軟件功能性(例如字處理應用)輸入信息(如文本),但是該用戶可能正在輸入與某一更特定的域(如醫學術語域)相關聯的文本。如果該用戶沒有意識到與他的/她的文本輸入相關聯的域字典(如醫學術語域字典)的可用性,則該用戶可能失去該可用域字典的有價值的資源。
本發明正是對于這些和其他考慮事項而作出的。
發明內容
本發明的實施例通過提供新詞檢測和域字典推薦來解決上述和其他問題。根據一個實施例,當根據某一給定語言(例如中文)接收到文本內容時,通過根據各種規則分析該內容來從該內容中提取詞,這些規則包括停用詞規則、詞典子串和數序規則、前綴/后綴規則、以及語言模式規則。在排除了作為新詞被加入到詞語詞典的低價值的詞之后,剩下的詞被分級以便包含在一個或多個詞語詞典和/或特定域字典中,以供將來用于諸如文本輸入法、拼寫檢查、語法檢查、自動輸入完成、定義等之類的功能性。
根據另一實施例,當用戶正在根據一個或多個規定的域字典輸入或編輯文本時,可作出關于是否更多有幫助的域字典可用的判斷。用戶輸入的詞被提取并與各種可用的域字典中所包含的詞進行比較。如果作出用戶輸入的詞具有與用戶不正在使用的某一域字典的高度關聯性的判斷,則可向用戶推薦該域字典以增加用戶輸入額外文本和編輯現有文本的準確性。
一個或多個實施例的細節在附圖和以下描述中闡明。通過閱讀下面的詳細描述并參考相關聯的附圖,其他特征和優點將變得顯而易見。要理解的是下面的詳細描述僅僅是解釋性的,而不是對所要求保護的發明的限制。
提供本發明內容以便以簡化的形式介紹將在以下詳細描述中進一步描述的一些概念。本發明內容并不旨在標識出所要求保護的主題的關鍵特征或必要特征,也不旨在用于幫助確定所要求保護的主題的范圍。
附圖說明
合并在本公開中并構成其一部分的附圖例示出本發明的實施例。
圖1例示出平板型計算設備的顯示屏上顯示的根據某一語言(例如中文)的文本內容,從中可檢測到一個或多個新的詞以包含在給定域字典中。
圖2例示出用于從一個或多個源接收文本內容以及用于經新詞檢測引擎來從該文本內容檢測一個或多個新詞的系統架構。
圖3是用于檢測包含在接收到的或輸入的文本內容選擇中的新詞的方法的流程圖。
圖4例示出用于對接收到的或輸入的文本內容的域字典推薦的系統架構。
圖5是用于與所接收到的或輸入的文本內容相關聯地推薦一個或多個域字典的方法的流程圖。
圖6例示出用于與所接收到的或輸入的文本內容相關聯地向用戶推薦域字典的示例彈出對話框。
圖7是例示出可用來實施本發明的各實施例的計算設備的示例物理組件的簡化框圖。
圖8A和8B是可用來實施本發明的各實施例的移動計算設備的簡化框圖。
圖9是可在其中實施本發明的各實施例的分布式計算系統的簡化框圖。
具體實施方式
如上簡述,本發明的實施例涉及提供新詞檢測和域字典推薦。當根據某一給定語言(例如中文)接收到文本內容時,通過根據各種規則分析該內容來從該內容中提取詞。在排除了作為新詞被加入到給定域字典的價值低的詞之后,剩下的詞被分級以便包含在一個或多個詞語詞典和/或特定域字典中,以供將來用于諸如文本輸入法、拼寫檢查、語法檢查、自動輸入完成、定義等之類的功能性。此外,當用戶正在根據一個或多個規定的域字典輸入或編輯文本時,可作出關于是否有更多有幫助的域字典可用的判斷。如果作出用戶輸入的詞具有與用戶不正在使用的某一域字典的高度關聯性的判斷,則可向用戶推薦該域字典以增加用戶輸入額外文本和編輯現有文本的準確性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微軟技術許可有限責任公司,未經微軟技術許可有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201380044316.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:自適應行為的神經系統
- 下一篇:基于符號空間的模式壓縮的多層系統





