[發明專利]單詞的音節記錄方法及裝置有效
| 申請號: | 202110079369.6 | 申請日: | 2021-01-21 |
| 公開(公告)號: | CN112905024B | 公開(公告)日: | 2023-10-27 |
| 發明(設計)人: | 李博林 | 申請(專利權)人: | 李博林 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023;G06F16/31;G06F40/216;G06F40/284;G06F40/289 |
| 代理公司: | 深圳市育科知識產權代理有限公司 44509 | 代理人: | 何凱威 |
| 地址: | 100000 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 單詞 音節 記錄 方法 裝置 | ||
本申請適用于字母輸入法技術領域,提供了一種單詞的音節記錄方法,包括從待處理的若干詞語中獲取至少一個單詞,單詞中包含至少三個字母,將單詞按照預設單詞拼讀規則進行拆分得到訓練集,訓練集包括所述預設單詞拼讀規則的音節索引及每個字母在音節索引中的位置信息,對訓練集進行切分確定單詞中的至少兩個字母及兩個字母組合的字符串對應所述位置信息的條件概率,基于條件概率確定目標單詞以及目標音節對應的目標音節索引,目標音節索引滿足預設單詞拼讀規則。本申請還提供了單詞的音節記錄裝置,保證數據庫中對單詞、單詞音節進行有效管理,大大提高了單詞記錄的速度。
技術領域
本申請屬于字母輸入法技術領域,尤其涉及一種單詞的音節記錄方法及裝 置。
背景技術
發明內容
本申請實施例提供了一種單詞的音節記錄方法及裝置,可以解決用戶只需 要問題。
第一方面,本申請實施例提供了一種單詞的音節記錄方法,包括:
從待處理的若干詞語中獲取至少一個單詞,所述單詞中包含至少三個字母;
將所述單詞按照預設單詞拼讀規則進行拆分得到訓練集,所述訓練集包括 所述預設單詞拼讀規則的音節索引及每個所述字母在所述音節索引中的位置信 息;
對所述訓練集進行切分確定所述單詞中的至少兩個字母及所述兩個字母組 合的字符串對應所述位置信息的條件概率;
基于所述條件概率確定目標單詞以及所述目標音節對應的目標音節索引, 所述目標音節索引滿足所述預設單詞拼讀規則。
作為上述技術方案的進一步改進,所述基于所述條件概率確定目標單詞以 及所述目標音節對應的目標音節索引,包括:
獲取所述字符串中的第一字母及所述第一字母對應的第一位置信息;
根據所述第一字母及所述第一位置信息確定與所述第一字母關聯的第二字 母;
計算所述第一字母、所述第一位置信息及所述第二字母同時存在于所述目 標單詞中的條件概率。
作為上述技術方案的進一步改進,所述計算所述第一字母、所述第一位置 信息及所述第二字母同時存在于所述目標單詞中的條件概率,包括:
將所述目標單詞按照所述預設拼讀規則進行切分得到切分結果,所述切分 結果包括所述目標單詞及所述目標單詞對應的目標音節;
判斷所述切分結果是否存在于數據庫中;
若否,將所述目標音節、所述目標單詞及所述目標音節索引存儲至所述數 據庫。
作為上述技術方案的進一步改進,所述音節索引包括音節的開頭、中段和 結尾,所述音節的開頭、中段和結尾對應所述單詞中的至少一個字母。
作為上述技術方案的進一步改進,當所述單詞的預設單詞拼讀規則對應的 音節索引的數量為三,遍歷所述單詞的每個字母得到每個所述字母的第二位置 信息、以及生成所述單詞對應的第一訓練集;
根據所述第二位置信息和所述音節索引得到第一字符串、第二字符串和第 三字符串、以及所述第一字符串、第二字符串和第三字符串中的字母數值,其 中每個字符串包含至少兩個字母;
將所述第一字母串、所述第二字母串和所述第三字母串分別標記為開頭音 節、中段音節和結尾音節,根據每個字母串中的字母數值和所述第二位置信息 對應標記每個字母。
作為上述技術方案的進一步改進,在生成所述單詞第一訓練集之后,包括:
采用隱馬爾可夫模型對所述第一訓練集進行自動切分,所述第一訓練集對 應的條件概率表示為:
其中,以所述第一訓練集中存在于所述第一字母串的第一字母為例,那么 A、B分別表示為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于李博林,未經李博林許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110079369.6/2.html,轉載請聲明來源鉆瓜專利網。





