[發明專利]一種結構化文檔的生成方法、裝置及存儲介質在審
| 申請號: | 201811640368.9 | 申請日: | 2018-12-29 |
| 公開(公告)號: | CN109783787A | 公開(公告)日: | 2019-05-21 |
| 發明(設計)人: | 張海勇 | 申請(專利權)人: | 遠光軟件股份有限公司 |
| 主分類號: | G06F17/24 | 分類號: | G06F17/24;G06F17/22 |
| 代理公司: | 深圳市威世博知識產權代理事務所(普通合伙) 44280 | 代理人: | 何倚雯 |
| 地址: | 519000 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 財務制度 結構化文檔 文檔 存儲介質 文本 結構文檔 人力成本 文檔模板 文檔轉換 預設格式 知識信息 指令信息 預設 申請 | ||
本申請公開了一種結構化文檔的生成方法、裝置及存儲介質,該方法包括獲取預設格式的待處理財務制度文檔,對待處理財務制度文檔進行段落劃分處理,將待處理財務制度文檔劃分為以段落為單元的段落文本;獲取段落文本對應的關鍵詞;將關鍵詞作為指令信息、將關鍵詞對應的段落文本作為知識信息輸入至預設的文檔模板,以生成結構化文檔。通過上述方案,可實現快速將財務制度文檔轉換為結構文檔,節省人力成本。
技術領域
本申請涉及文檔處理領域,特別是涉及一種結構化文檔的生成方法、裝置及存儲介質。
背景技術
在企業單位的日常管理中,會有各種各樣的財務方面制度文件或決策文件產生,且會隨著企業單位的發展修改或更新,如何快速將這些財務方面的制度文件快速有效有條理地導入至企業知識庫是企業目前面臨的困難。而在現有技術中,則多是采用人工進行抽取和編輯,然后輸入至企業知識庫中,由于這樣會占用大量的人力,且由于人工處理過程中完全靠人工操作是會有較高出錯風險,故需要一種可以解決上述技術問題的方案。
發明內容
本申請主要解決的技術問題是提供一種可快速生成結構化文檔的方法。
為解決上述技術問題,本申請采用的一個技術方案是:提供一種結構化文檔的生成方法,所述方法包括:
獲取預設格式的待處理財務制度文檔;
對所述待處理財務制度文檔進行段落劃分處理,將所述待處理財務制度文檔劃分為以段落為單元的段落文本;
獲取所述段落文本對應的關鍵詞;
將所述關鍵詞作為指令信息、將所述關鍵詞對應的所述段落文本作為知識信息輸入至預設的文檔模板,以生成結構化文檔。
為解決上述技術問題,本申請采用的另一個技術方案是,提供一種結構化文檔的生成裝置,所述裝置包括相互連接的處理器和存儲器;
其中,所述存儲器用于存儲程序數據;
所述處理器用于運行所述程序數據,以執行如上所述的結構化文檔的生成方法。
為解決上述技術問題,本申請采用的又一個技術問題是,提供一種存儲介質,所述存儲介質存儲有程序數據,所述程序數據被執行時實現如上所述的結構化文檔的生成方法。
以上方案,通過對所獲取的待處理財務制度文檔進行段落劃分處理,以將待處理財務制度文檔劃分為以段落為單元的段落文本,獲取段落文本對應的關鍵詞,將關鍵詞作為指令信息、將關鍵詞對應的段落文本作為知識信息輸入至預設的文檔模板,生成結構化文檔,在此過程中無需人工操作,僅基于機器即可基于財務制度文檔快速生成結構化文檔,提高了結構化文檔的生成效率。
附圖說明
圖1是本申請一種結構化文檔的生成方法一實施例中的流程示意圖;
圖2是本申請一種結構化文檔的生成方法另一實施例中的流程示意圖;
圖3是本申請一種結構化文檔的生成方法又一實施例的流程示意圖;
圖4是本申請一種結構化文檔的生成裝置一實施例中的結構示意圖;
圖5是本申請一種存儲介質一實施例中的結構示意圖。
具體實施方式
下面將結合本申請實施例中的附圖,對本申請實施例中的技術方案進行清楚、完整地描述。可以理解的是,此處所描述的具體實施例僅用于解釋本申請,而非對本申請的限定。基于本申請中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬于本申請保護的范圍。
本申請中的術語“第一”、“第二”、“第三”僅用于描述目的,而不能理解為指示或暗示相對重要性或者隱含指明所指示的技術特征的數量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于遠光軟件股份有限公司,未經遠光軟件股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811640368.9/2.html,轉載請聲明來源鉆瓜專利網。





