[發明專利]基于災情表單自動生成災情報告的方法及系統在審
| 申請號: | 201710400461.1 | 申請日: | 2017-05-31 |
| 公開(公告)號: | CN107315728A | 公開(公告)日: | 2017-11-03 |
| 發明(設計)人: | 張鵬;張云霞;范春波;張妮娜;孫舟;張弛;呂明;劉南江;丁一;汪洋;劉哲;陸野;費偉;任景軍;牟新利 | 申請(專利權)人: | 民政部國家減災中心;北京方位捷訊科技有限公司 |
| 主分類號: | G06F17/24 | 分類號: | G06F17/24;G06F17/30 |
| 代理公司: | 北京酷愛智慧知識產權代理有限公司11514 | 代理人: | 孟凡臣 |
| 地址: | 100124*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 災情 表單 自動 生成 報告 方法 系統 | ||
技術領域
本發明涉及信息科學技術領域,具體涉及基于災情表單自動生成災情報告的方法及系統。
背景技術
目前,由于災情報告公文包括以下幾點特殊性:不同數量級災情指標的差異化進位格式、標準行政區劃的復雜表述格式、長短句間的斷句和標點使用規則等。由于上述災情報告公文的特殊性,使得基于現有技術無法準確地按照公文要求對結構化的災情表單進行文本轉化,形成符合自然語言規則的災情報告,因此,需要人工制作災情報告,這增加了制作報告的時間,提高了人工成本,同時人工制作過程中極易出錯。
發明內容
針對現有技術中的缺陷,本發明提供的基于災情表單自動生成災情報告的方法及系統,能夠依據結構化的災情表單數據,按公文語言格式標準化、自動地化生成災情報告文本。
第一方面,本發明提供的一種基于災情表單自動生成災情報告的方法,包括:
獲取災情的災情表單;
提取所述災情表單中的受災區域,從數據庫中提取所述受災區域包括的行政區域,根據提取的行政區域生成受災區域文本段落;
提取所述災情表單中的災情指標數據,將所述災情指標數據轉化為標準指標數值后填入預先設定的指標文本中形成災情文本段落;
連接所述受災區域文本段落和所述災情文本段落得到符合自然語言規則的災情報告。
本實施例提供的基于災情表單自動生成災情報告的方法,以結構化表單數據為基礎,按照一定自然語言規則自動化的生成災情報告文本,不僅極大提升了業務工作效率、提高了災情發布效率,而且將災情報告中出現數據錯誤的概率將至最低。
優選地,所述提取所述災情表單中的受災區域,從數據庫中提取所述受災區域包括的行政區域,根據提取的行政區域生成受災區域文本段落,包括:
提取所述災情表單中的受災區域;
從數據庫中提取所述受災區域包括的行政區域形成受災區域列表;
統計所述受災區域列表中行政區域的區劃名稱的字數得到總文字數量;
若所述總文字數量超過預設的字數閾值,則縮減所述受災區域列表中的行政區域的區劃名稱,否則,保持所述受災區域列表中的行政區域的區劃名稱不變;
根據所述受災列表中行政區域的區劃名稱生成受災區域文本段落。
優選地,所述縮減所述受災區域列表中的行政區域的區劃名稱,包括:
根據預先構建的區劃名稱縮寫詞庫,對所述受災區域列表中的行政區域的區劃名稱采用縮寫進行替換。
優選地,所述縮減所述受災區域列表中的行政區域的區劃名稱,包括:按照區劃繼承關系,對所述受災區域列表中的行政區域進行合并,得到縮減后的受災區劃列表。
優選地,所述形成受災區域列表之前還包括:根據預先構建的第一列表過濾所述受災區域列表,剔除所述受災區域列表中的特殊區域,所述特殊區域包括空頭市和直管縣,所述第一列表包括所有空頭市和直管縣;
所述根據所述受災列表中行政區域的區劃名稱生成受災區域文本段落,包括:將所述特殊區域與所述受災區域列表中的行政區劃名稱進行掛接,生成受災區域文本段落。
優選地,提取所述災情表單中的災情指標數據,將所述災情指標數據轉化為標準指標數值后填入預先設定的指標文本中形成災情文本段落,包括:
提取所述災情表單中的災情指標數據,所述災情指標數據標注有指標類別,一種指標類別對應一種災情指標,每個在災情指標包含至少一個子級指標;
對不同指標類別的災情指標數據分別進行如下操作:將所述災情指標數據轉化為標準指標數值,確定每個所述標準指標數值對應的子級指標,將所述標準指標數值寫入各子級指標對應的指標文本中,連接各個子級指標的指標文本得到單類指標文本;
連接所有單項指標文本得到形成災情文本段落。
優選地,所述將所述災情指標數據轉化為標準指標數值,包括:
根據所述災情指標數據確定數量級,
根據所述數量級對所述災情指標數據進行進位處理,并添加與所述數量級對應的單位詞得到標準指標數據。
優選地,還包括:
對各類災情指標的子級指標寫入數量進行統計;
若各類災情指標的子級指標寫入數量均為1,則所述連接所有單項指標文本得到形成災情文本段落包括:采用一級分割符號連接所有單項指標文本得到形成災情文本段落,所述災情文本段落末尾用句號匹配;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于民政部國家減災中心;北京方位捷訊科技有限公司,未經民政部國家減災中心;北京方位捷訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710400461.1/2.html,轉載請聲明來源鉆瓜專利網。





