[發明專利]輸入法的候選詞語的排序方法和排序設備在審
| 申請號: | 201610702677.9 | 申請日: | 2016-08-22 |
| 公開(公告)號: | CN107765883A | 公開(公告)日: | 2018-03-06 |
| 發明(設計)人: | 方瑞玉;繆慶亮;孟遙;房璐 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023;G06F17/27 |
| 代理公司: | 北京集佳知識產權代理有限公司11227 | 代理人: | 王萍,吳瓊 |
| 地址: | 日本神*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 輸入法 候選 詞語 排序 方法 設備 | ||
技術領域
本發明一般地涉及信息處理領域。具體而言,本發明涉及一種能夠對輸入法的候選詞語進行排序的方法和設備。
背景技術
隨著信息技術的發展,人們的工作、學習、生活中處處可見基于信息技術的產品。在使用基于信息技術的產品中,人機交互的基本而重要的方面是輸入法。輸入法包括拼音輸入法和語音輸入法,其輸入分別是拼音輸入和聲碼輸入等。
這兩種輸入法共同面對的問題就是候選不唯一。針對用戶的單位輸入,輸入法不得不提供多個候選詞語供用戶選擇。評價輸入法的重要因素就是輸入法的命中率。高命中率能夠顯著改善用戶體驗。這就需要輸入法提供的候選詞語接近用戶的意圖,并且排序靠前的候選詞語是用戶希望輸入的詞語的概率高。
傳統的方法通常采用語言模型來對候選詞語進行排序。通常,語言模型計算候選詞語出現在一句話中的語言模型分數,基于語言模型分數對候選詞語進行排序。
傳統的方法存在的問題是給出的候選詞語的排序與用戶真實意圖存在差距。
本發明致力于解決上述問題,提高候選詞語的命中率,改善用戶體驗。
發明內容
在下文中給出了關于本發明的簡要概述,以便提供關于本發明的某些方面的基本理解。應當理解,這個概述并不是關于本發明的窮舉性概述。它并不是意圖確定本發明的關鍵或重要部分,也不是意圖限定本發明的范圍。其目的僅僅是以簡化的形式給出某些概念,以此作為稍后論述的更詳細描述的前序。
本發明的目的是提出一種對輸入法的候選詞語進行排序的方法和設備。根據本發明的方法和設備,排在靠前位置的候選詞語是用戶希望輸入的詞語的概率大,用戶體驗好。
為了實現上述目的,根據本發明的一個方面,提供了一種輸入法的候選詞語排序方法,該方法包括:獲得與當前輸入對應的多個候選詞語;確定多個候選詞語中的每一個候選詞語與參考詞語之間的語義相關度;以及根據所確定的語義相關度,對多個候選詞語進行排序;其中,確定多個候選詞語中的每一個候選詞語與參考詞語之間的語義相關度包括:針對每一個候選詞語,計算其語義向量與參考詞語的語義向量的相似度之和或平均相似度,作為所述語義相關度;其中,所述每一個候選詞語的語義向量通過如下步驟獲得:將所述每一個候選詞語鏈接到預定知識庫中的一個或多個候選實體;以及將所述候選實體的描述輸入到語義模型,以得到對應的語義向量。
根據本發明的另一個方面,提供了一種輸入法的候選詞語排序設備,該設備包括:候選詞語獲得裝置,被配置為:獲得與當前輸入對應的多個候選詞語;語義相關度確定裝置,被配置為:確定多個候選詞語中的每一個候選詞語與參考詞語之間的語義相關度;以及排序裝置,被配置為:根據所確定的語義相關度,對多個候選詞語進行排序;其中,所述語義相關度確定裝置包括:第一語義向量獲得單元,被配置為:將所述每一個候選詞語鏈接到預定知識庫中的一個或多個候選實體;以及將所述候選實體的描述輸入到語義模型,以得到對應的語義向量,作為所述每一個候選詞語的語義向量;以及相似度計算單元,被配置為:針對每一個候選詞語,計算其語義向量與參考詞語的語義向量的相似度之和或平均相似度,作為所述語義相關度。
根據本發明的又一方面,提供了一種信息處理設備。所述信息處理設備包括:控制器,被配置為:獲得與當前輸入對應的多個候選詞語;確定多個候選詞語中的每一個候選詞語與參考詞語之間的語義相關度;以及根據所確定的語義相關度,對多個候選詞語進行排序;其中,確定多個候選詞語中的每一個候選詞語與參考詞語之間的語義相關度包括:針對每一個候選詞語,計算其語義向量與參考詞語的語義向量的相似度之和或平均相似度,作為所述語義相關度;其中,所述每一個候選詞語的語義向量通過如下步驟獲得:將所述每一個候選詞語鏈接到預定知識庫中的一個或多個候選實體;以及將所述候選實體的描述輸入到語義模型,以得到對應的語義向量。
另外,根據本發明的另一方面,還提供了一種存儲介質。所述存儲介質包括機器可讀的程序代碼,當在信息處理設備上執行所述程序代碼時,所述程序代碼使得所述信息處理設備執行根據本發明的上述方法。
此外,根據本發明的再一方面,還提供了一種程序產品。所述程序產品包括機器可執行的指令,當在信息處理設備上執行所述指令時,所述指令使得所述信息處理設備執行根據本發明的上述方法。
附圖說明
參照下面結合附圖對本發明的實施例的說明,會更加容易地理解本發明的以上和其它目的、特點和優點。附圖中的部件只是為了示出本發明的原理。在附圖中,相同的或類似的技術特征或部件將采用相同或類似的附圖標記來表示。附圖中:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610702677.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種財務專用鍵盤
- 下一篇:一種滑行輸入方法、裝置及電子設備





