[發明專利]一種信息處理方法、裝置及電子設備有效
| 申請號: | 201710283791.7 | 申請日: | 2017-04-26 |
| 公開(公告)號: | CN107145947B | 公開(公告)日: | 2020-08-07 |
| 發明(設計)人: | 姬東鴻;孟曉靜;張晨 | 申請(專利權)人: | 北京漢王數字科技有限公司 |
| 主分類號: | G06N5/02 | 分類號: | G06N5/02 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100193 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 信息處理 方法 裝置 電子設備 | ||
本發明提供了一種信息處理方法,屬于自然語言處理領域,解決了現有技術中進行獲取地方志信息時效率低下的問題。所述方法包括:對地方志文本數據進行預處理;對預處理得到的每條描述內容進行知識抽取,得到所述每條描述內容分別包含的屬性知識;基于得到的所述屬性知識和所述屬性知識所屬描述內容的上下文,對所述屬性知識進行修改。本發明公開的信息處理方法,通過基于上下文的描述內容,進行屬性知識完善,可以準確地完善地方志文本數據,進一步提高獲取地方志信息的效率。
技術領域
本發明涉及自然語言處理領域,尤其涉及一種信息處理方法及裝置,電子設備。
背景技術
地方志是按一定體例全面記載某一時期某一地域的自然、社會、政治、經濟、文化等方面情況的書籍文獻。由于地方志會分為多個卷次編撰和記載,歷史久遠的地方志經常會出現由于保存不當而導致破損或丟失的情況,造成歷史資料的缺失。并且,由于地方志會分為多個卷次編撰和記載,如何從地方志中獲取完整的知識一直是很困難的問題。現有技術中,在獲取地方志中記載的資料時,只能通過人工翻越多卷資料的方式,費事費力,效率低下。
知識抽取是指把蘊含于信息源中的知識經過識別、理解、篩選、歸納等過程抽取出來,存儲形成知識元庫。目前研究較多的是針對自然語言文本的知識抽取。知識抽取已經成為自然語言處理領域一個重要的研究分支。
綜上,如何高效地從地方志中獲取完整的信息,是一個承待解決的問題。
發明內容
本發明實施例提供一種信息處理方法及裝置,通過完善地方志信息,以解決現有技術中進行獲取地方志信息時效率低下的問題。
第一方面,本發明實施例提供了一種信息處理方法,包括:
對地方志文本數據進行預處理;
對預處理得到的每條描述內容進行知識抽取,得到所述每條描述內容分別包含的屬性知識;
基于得到的所述屬性知識和所述屬性知識所屬描述內容的上下文,對所述屬性知識進行修改。
第二方面,本發明實施例還提供了一種信息處理裝置,裝置包括:
預處理模塊,用于對地方志文本數據進行預處理;
屬性知識抽取模塊,用于對預處理得到的每條描述內容進行知識抽取,得到所述每條描述內容分別包含的屬性知識;
信息完善模塊,用于基于得到的所述屬性知識和所述屬性知識所屬描述內容的上下文,對所述屬性知識進行修改。
第三方面,本發明實施例還提供了一種電子設備,包括存儲器、處理器及存儲在所述存儲器上并可在處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現本發明實施例所述的信息處理方法。
第四方面,本發明實施例還提供了一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執行時實現本發明實施例所述的信息處理方法的步驟。
這樣,本發明實施例公開的信息處理方法,通過對地方志文本數據進行預處理,然后,對預處理得到的每條描述內容進行知識抽取,得到所述每條描述內容分別包含的屬性知識,最后,基于得到的所述屬性知識和所述屬性知識所屬描述內容的上下文,對所述屬性知識進行修改,解決了現有技術中由于地方志數據不完整導致的獲取地方志信息時效率低下的問題。通過基于上下文的描述內容,進行屬性知識完善,可以準確地完善地方志文本數據,進一步提高獲取地方志信息的效率。
附圖說明
為了更清楚地說明本發明實施例的技術方案,下面將對本發明實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京漢王數字科技有限公司,未經北京漢王數字科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710283791.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種組合式空預器軸向密封裝置
- 下一篇:一種便于安裝的視頻監控設備





