[發明專利]一種文本復制粘貼方法、系統及可讀存儲介質有效
| 申請號: | 202010612028.6 | 申請日: | 2020-06-30 |
| 公開(公告)號: | CN111831460B | 公開(公告)日: | 2023-06-16 |
| 發明(設計)人: | 薛麗 | 申請(專利權)人: | 江西科技學院 |
| 主分類號: | G06F9/54 | 分類號: | G06F9/54;G06F40/117 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 何世磊 |
| 地址: | 330098 江西省南*** | 國省代碼: | 江西;36 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 復制 粘貼 方法 系統 可讀 存儲 介質 | ||
1.一種文本復制粘貼方法,應用于復制原文檔的文本并粘貼至目標文檔,其特征在于,包括以下步驟:
當接收到文本粘貼指令時,獲取格式配置信息,所述格式配置信息為自定義格式或所述目標文檔的目標格式;
對所述目標文檔執行去格式化和文本分析,得到預處理文檔;
將格式配置信息和所述目標文檔的文件類型結合,得到具體格式配置信息,根據所述格式配置信息調整所述預處理文檔的文本格式;
所述文本分析為基于所述目標文檔的文本格式,對所述目標文檔進行角色標注;
所述角色標注的步驟包括:
若所述原文檔和所述目標文檔為相同文件類型,提取所述原文檔中所有的標題段落;
獲取所述標題段落的字體信息、字號信息和加粗信息,根據下式計算得到加權特征值P,以P作為所述角色標注的指標:
P=α·A+β·B+γ·C
式中,α、β和γ分別為所述字體信息、字號信息和加粗信息預設的權重值,A、B和C分別所述字體信息、字號信息和加粗信息預設的特征值。
2.根據權利要求1所述的文本復制粘貼方法,其特征在于,所述格式配置信息包括格式化目的信息。
3.根據權利要求1所述的文本復制粘貼方法,其特征在于,所述角色標注為語義角色標注,或通過命名實體識別獲取角色進行標注。
4.根據權利要求1所述的文本復制粘貼方法,其特征在于,所述角色標注的步驟還包括:
若所述原文檔與所述目標文檔的文件類型不相同,更改所述字體信息、字號信息和加粗信息,所述更改后的字體信息、字號信息和加粗信息匹配所述目標文檔。
5.一種文本復制粘貼系統,其特征在于,包括:
獲取模塊,用于當接收到文本粘貼指令時,獲取格式配置信息,所述格式配置信息為自定義格式或目標文檔的目標格式;
預處理模塊,用于對所述目標文檔執行去格式化和文本分析,得到預處理文檔;
調整模塊,用于將格式配置信息和所述目標文檔的文件類型結合,得到具體格式配置信息,根據所述格式配置信息調整所述預處理文檔的文本格式;
所述文本分析為基于所述目標文檔的文本格式,對所述目標文檔進行角色標注;
所述角色標注的步驟包括:
若原文檔和所述目標文檔為相同文件類型,提取所述原文檔中所有的標題段落;
獲取所述標題段落的字體信息、字號信息和加粗信息,根據下式計算得到加權特征值P,以P作為所述角色標注的指標:
P=α·A+β·B+γ·C
式中,α、β和γ分別為所述字體信息、字號信息和加粗信息預設的權重值,A、B和C分別所述字體信息、字號信息和加粗信息預設的特征值。
6.一種可讀存儲介質,其上存儲有計算機指令,其特征在于,該指令被處理器執行時實現權利要求1至4任意一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江西科技學院,未經江西科技學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010612028.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于特征組合的樸素貝葉斯巖相分類方法及裝置
- 下一篇:一種太陽能板除塵裝置





