[發明專利]生成候選詞的方法及裝置在審
| 申請號: | 201911298337.4 | 申請日: | 2019-12-17 |
| 公開(公告)號: | CN112987941A | 公開(公告)日: | 2021-06-18 |
| 發明(設計)人: | 劉世軍 | 申請(專利權)人: | 北京搜狗科技發展有限公司 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023 |
| 代理公司: | 北京華圣典睿知識產權代理有限公司 11510 | 代理人: | 趙景平 |
| 地址: | 100084 北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 生成 候選 方法 裝置 | ||
本發明公開了一種生成候選詞的方法及裝置,該方法包括:實時接收用戶輸入的當前輸入串;查找詞庫中是否有與當前輸入串對應的候選詞;如果有,則將候選詞作為第一候選詞進行展現;如果沒有,則對當前輸入串進行切分,得到各子串;從詞庫中獲取與各子串對應的各候選詞及其屬性;分別從各子串對應的候選詞中選取一個候選詞組成目標詞組;將目標詞組作為第一候選詞進行展現。本發明實施例提供的方案,在生成候選詞的過程中,先查找詞庫中的詞語,而當詞庫中不存在候選詞時,考慮將當前輸入串拆分為多個子串并組成目標詞語,并且還考慮了各個子串的屬性,這樣能夠有效提高生成用戶期望的候選詞的準確性,有利于提高用戶輸入效率。
技術領域
本發明涉及輸入法技術領域,具體涉及一種生成候選詞的方法及裝置。
背景技術
輸入法是一種將各種符號輸入計算機或其他設備的編碼方法,是人類和計算機打交道不可或缺的工具。對于中文輸入,拼音輸入法是人們最常用的輸入法之一。對于輸入法系統而言,通常會將一些常用詞收錄在詞庫中,輸入法系統根據用戶輸入的拼音串,首先會查找詞庫,如果查不到,則進行一元組詞。所述一元組詞是指對接收的拼音串進行切分,然后選擇切分得到的每個子串對應的詞頻最高的詞進行組詞。比如,用戶輸入的拼音串為“zhoukoudianyizhi”(周口店遺址),但查找詞庫未得到相應的詞,在這種情況下,輸入法系統對拼音串“zhoukoudianyizhi”進行拆分,得到兩個子串,分別為“zhoukoudian”和“yizhi”,由于這兩個子串對應的詞頻最高的詞分別為“周口店”和“一直”,因此生成“周口店一直”這個候選詞。再比如,用戶輸入拼音串“dengdaichaoshi”(等待超時),輸入法系統會生成候選詞“等待超市”。顯然,這樣的候選詞并不是用戶真正想要的候選詞,不僅影響用戶輸入效率,還會影響用戶輸入體驗。
發明內容
本發明實施例提供一種生成候選詞的方法及裝置,以提高用戶輸入效率,提高用戶輸入體驗。
為此,本發明提供如下技術方案:
一種生成候選詞的方法,所述方法包括:
實時接收用戶輸入的當前輸入串;
查找詞庫中是否有與所述當前輸入串對應的候選詞,所述詞庫中的各詞具有屬性標記;
如果有,則將所述候選詞作為第一候選詞進行展現;
如果沒有,則對所述當前輸入串進行切分,得到各子串;
從所述詞庫中獲取與各子串對應的各候選詞及其屬性;
分別從各子串對應的候選詞中選取一個候選詞組成目標詞組,所述目標詞組中的候選詞的屬性相關;
將所述目標詞組作為第一候選詞進行展現。
可選地,所述分別從各子串對應的候選詞中選取一個候選詞組成目標詞組包括:
按照各子串在所述當前輸入串中的先后順序,根據在先子串對應的候選詞的屬性依次從在后子串對應的候選詞中選取一個候選詞組成目標詞語。
可選地,所述根據在先子串對應的候選詞的屬性依次從在后子串對應的候選詞中選取一個候選詞組成目標詞語包括:
依次判斷在后子串對應的候選詞中是否有與在先子串對應的候選詞的屬性相關的候選詞;
如果有,則從在后子串對應的候選詞中選取屬性相關的候選詞組成目標詞語;
如果沒有,則從在后子串對應的候選詞中選取詞頻最高的候選詞組成目標詞語。
可選地,在所述查找詞庫中是否有與所述當前輸入串對應的候選詞之前,還包括:
獲取已上屏詞語的屬性;
根據所述已上屏詞語的屬性,對所述當前輸入串對應的各候選詞進行詞頻調整。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗科技發展有限公司,未經北京搜狗科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911298337.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種商業制冷用換熱器
- 下一篇:玻璃鑒定元件、玻璃鑒定器及玻璃鑒定方法





