[發明專利]文本生成方法、裝置、計算機設備及計算機可讀存儲介質有效
| 申請號: | 202110259633.4 | 申請日: | 2021-03-10 |
| 公開(公告)號: | CN112766236B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 賈偉;汪安輝 | 申請(專利權)人: | 拉扎斯網絡科技(上海)有限公司 |
| 主分類號: | G06V30/182 | 分類號: | G06V30/182;G06V30/19 |
| 代理公司: | 北京中強智尚知識產權代理有限公司 11448 | 代理人: | 黃耀威 |
| 地址: | 200333 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 生成 方法 裝置 計算機 設備 可讀 存儲 介質 | ||
1.一種文本生成方法,其特征在于,包括:
獲取待處理字符串,將所述待處理字符串劃分為多個單字符;
為所述多個單字符中每個單字符確定多個候選字符,所述多個候選字符與相應單字符的拼音字符串一致,和/或與所述單字符的字符結構匹配,和/或與所述單字符的字符形狀匹配,和/或與所述單字符的字符筆畫匹配,和/或是所述單字符的繁體字符;
計算所述每個單字符與基于所述單字符確定的多個候選字符的相似度,將所述多個候選字符中相似度符合預設條件的候選字符作為所述單字符的變異單字符,得到所述每個單字符的變異單字符,其中,在讀音、結構、形狀以及筆畫維度分別計算所述每個單字符與對應的候選字符的多維度相似度,并對所述多維度相似度進行回歸計算得到所述每個單字符與對應的候選字符的相似度;
按照所述多個單字符在所述待處理字符串中的排列順序,對所述多個單字符以及所述多個單字符中每個單字符對應的變異單字符依次進行排列組合,得到所述待處理字符串的異常字符串。
2.根據權利要求1所述的方法,其特征在于,所述為所述多個單字符中每個單字符確定多個候選字符,包括:
確定所述每個單字符的拼音字符串,在預設字符庫里提取拼音字符串與所述單字符的拼音字符串一致的所述多個候選字符;和/或,
確定所述每個單字符的字符結構,在所述預設字符庫里提取字符結構與所述單字符的字符結構匹配的所述多個候選字符;和/或,
將所述每個單字符拆分為多個字符區域,在所述預設字符庫中提取包括一個或一個以上所述字符區域的多個預設字符作為與所述單字符的字符形狀匹配的多個候選字符;和/或,
統計所述每個單字符的字符筆畫,基于第一筆畫閾值和第二筆畫閾值形成筆畫區間,將所述預設字符庫中字符筆畫位于所述筆畫區間的多個預設字符作為與所述單字符的字符筆畫匹配的多個候選字符,所述第一筆畫閾值等于所述字符筆畫與第一預設系數的差值,所述第二筆畫閾值等于所述字符筆畫與第二預設系數的和值;和/或,
在所述預設字符庫中查詢所述每個單字符對應的繁體字符,將查詢到的所述繁體字符作為所述單字符的多個候選字符。
3.根據權利要求1所述的方法,其特征在于,所述計算所述每個單字符與基于所述單字符確定的多個候選字符的相似度,包括:
對于所述多個候選字符中每個候選字符,計算所述候選字符與所述單字符的讀音相似度、結構相似度、形狀相似度以及筆畫相似度;
對所述讀音相似度、所述結構相似度、所述形狀相似度以及所述筆畫相似度進行回歸計算,得到所述候選字符與所述單字符的字符相似度;
分別為所述多個候選字符中每個候選字符計算與所述單字符的字符相似度,得到所述多個候選字符的相似度。
4.根據權利要求3所述的方法,其特征在于,所述計算所述候選字符與所述單字符的讀音相似度、結構相似度、形狀相似度以及筆畫相似度,包括:
統計所述候選字符的拼音字符串包括的拼音字符的第一數量以及所述單字符的目標拼音字符串包括的拼音字符的第二數量,計算所述第一數量與所述第二數量的第一差值,將所述第一差值與所述第一數量、所述第二數量進行比對,輸出所述讀音相似度;
將所述候選字符的字符結構與所述單字符的字符結構進行比對,將比對結果指示的預設相似度作為所述結構相似度;
創建所述候選字符的第一字符圖片以及所述單字符的第二字符圖片,計算所述第一字符圖片與所述第二字符圖片的像素重合度,將所述像素重合度作為所述形狀相似度;
統計所述候選字符的第一筆畫數以及所述單字符的第二筆畫數,計算所述第一筆畫數與所述第二筆畫數的第二差值,將所述第二差值與所述第一筆畫數、所述第二筆畫數進行比對,輸出所述筆畫相似度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于拉扎斯網絡科技(上海)有限公司,未經拉扎斯網絡科技(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110259633.4/1.html,轉載請聲明來源鉆瓜專利網。





