[發明專利]文檔生成方法和裝置、電子設備及存儲介質在審
| 申請號: | 202011615127.6 | 申請日: | 2020-12-30 |
| 公開(公告)號: | CN112733505A | 公開(公告)日: | 2021-04-30 |
| 發明(設計)人: | 謝智鵬;萬根順;高建清;劉聰;王智國;胡國平 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | G06F40/166 | 分類號: | G06F40/166 |
| 代理公司: | 深圳市威世博知識產權代理事務所(普通合伙) 44280 | 代理人: | 李申 |
| 地址: | 230088 安徽省*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文檔 生成 方法 裝置 電子設備 存儲 介質 | ||
1.一種文檔生成方法,其特征在于,包括:
獲取原始記錄數據;
利用識別模型對所述原始記錄數據進行處理,得到最終記錄文檔,其中,所述最終記錄文檔包括所述原始記錄數據對應的文本信息以及所述文本信息的衍生信息,所述衍生信息包括對所述文本信息添加的第一標記和/或從所述文本信息中提取的用于構成結構化信息的關鍵信息。
2.根據權利要求1所述的方法,其特征在于,在所述利用識別模型對所述原始記錄數據進行處理,得到最終記錄文檔之前,所述方法還包括:
獲取歷史最終記錄文檔中經用戶修改的衍生信息和/或用戶輸入的重點字符,作為參考信息;
所述利用識別模型對所述原始記錄數據進行處理,得到最終記錄文檔,包括:
利用所述識別模型基于所述參考信息對所述原始記錄數據進行處理,得到所述最終記錄文檔。
3.根據權利要求2所述的方法,其特征在于,所述利用所述識別模型基于所述參考信息對所述原始記錄數據進行處理,得到所述最終記錄文檔,包括:
對所述參考信息進行編碼,得到參考向量;
將所述參考向量輸入至所述識別模型,以調整所述識別模型在識別過程中的預設權重,其中,所述預設權重包括所述識別模型的注意力模塊對所述參考向量的注意力權重;
利用調整所述預設權重之后的所述識別模型對所述原始記錄數據進行處理,得到所述最終記錄文檔。
4.根據權利要求3所述的方法,其特征在于,所述參考信息包括所述用戶輸入的重點字符;其中,
所述預設權重還包括所述識別模型的解碼器對所述重點字符的識別權重,所述重點字符的所述識別權重越大,則越大概率被所述解碼器輸出;
和/或,所述對所述參考信息進行編碼,得到參考向量,包括:
將所述重點字符存放至關注池中,并在所述關注池的重點字符存放數量達到預設數量的情況下,刪除所述關注池中存放的部分所述重點字符;
對所述關注池中存放的所述重點字符進行編碼,得到重點字符參考向量。
5.根據權利要求1所述的方法,其特征在于,所述結構化信息包括思維導圖和知識樹狀圖中的至少一種;
和/或,所述最終記錄文檔中包括對所述文本信息中的部分字符添加的第二標記,添加所述第二標記的字符表示為所述關鍵信息;在所述利用識別模型對所述原始記錄數據進行處理,得到最終記錄文檔之后,所述方法還包括:
從所述最終記錄文檔中,提取添加所述第二標記的字符,作為所述關鍵信息;
利用所述關鍵信息生成所述結構化信息。
6.根據權利要求5所述的方法,其特征在于,所述第二標記包括所述結構化信息的一級或多級主題分別對應的內容和/或級別標記,所述內容標記為顏色標記或框標記。
7.根據權利要求1所述的方法,其特征在于,在所述利用識別模型對所述原始記錄數據進行處理,得到最終記錄文檔之前,所述方法還包括以下步驟,對所述識別模型進行訓練:
獲取樣本原始記錄數據和樣本最終記錄文檔,其中,所述樣本最終記錄文檔包括所述樣本原始記錄數據對應的樣本文本信息以及所述樣本文本信息的樣本衍生信息;
利用所述識別模型對樣本原始記錄數據進行處理,得到預測最終記錄文檔;
基于所述預設最終記錄文檔與所述樣本最終記錄文檔之間的差異,調整所述識別模型的參數。
8.根據權利要求7所述的方法,其特征在于,所述樣本衍生信息包括對所述樣本文本信息添加的樣本第一標記和/或從所述樣本文本信息中提取的用于構成樣本結構化信息的樣本關鍵信息,在所述利用所述識別模型對樣本原始記錄數據進行處理,得到預測最終記錄文檔之前,所述方法還包括:
將所述樣本原始記錄數據對應的樣本文本信息轉換為樣本文本向量,作為所述樣本第一記錄向量,為所述樣本關鍵信息添加樣本第二標記,并按照預設轉換規則,將所述樣本第一標記和所述樣本第二標記轉換成對應的樣本衍生向量,所述樣本文本向量和所述樣本衍生向量組成樣本第二記錄向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011615127.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種數據處理方法和裝置
- 下一篇:一種模塊化智能舟橋裝置及舟橋搭建方法





