[發明專利]基于本體的稿件自動審查方法在審
| 申請號: | 201510156543.7 | 申請日: | 2015-04-03 |
| 公開(公告)號: | CN104751230A | 公開(公告)日: | 2015-07-01 |
| 發明(設計)人: | 劉永堅;白立華;楊朝陽;楊慧;曾瑞;李文忠 | 申請(專利權)人: | 武漢理工大學;時代出版傳媒股份有限公司 |
| 主分類號: | G06Q10/00 | 分類號: | G06Q10/00;G06Q50/00;G06F17/30 |
| 代理公司: | 湖北武漢永嘉專利代理有限公司 42102 | 代理人: | 張惠玲 |
| 地址: | 430070 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 本體 稿件 自動 審查 方法 | ||
技術領域
本發明涉及數字出版物技術領域,尤其涉及到一種用于數字信息處理技術的基于本體的稿件自動審查方法。
背景技術
知識處理是信息技術發展的必然趨勢,隨著對知識應用要求越來越高,傳統的知識數據庫系統已經不能滿足新的需求,所以將本體引用到知識工程中,將本體相關原理技術運用到知識庫的開發中。
本體知識系統是20世紀70年代后期,專家系統、知識系統和知識密集型的信息系統的構建技術發展而形成知識工程,所建立的系統簡稱為知識系統(knowledge-based?systems)。知識系統是人工智能學科最重要的工業化和商業化產物。知識系統用于輔助人們進行問題求解,如檢測信用卡詐騙、加速船舶設計、輔助醫療診斷、使科學軟件更加智能化、向全體決策人員提供金融服務、產品質量的評價和廣告宣傳、支持電子網絡的服務恢復。
隨著知識系統的發展與流行,知識服務也成為了信息技術發展的必然趨勢,基于本體的知識工程應用開始受人矚目,在數字出版行業的知識服務是知識工程新的應用領域,目前人們還在依靠人工方式進行稿件審核,還沒有一種自動化的基于領域本體的審稿技術。
發明內容
本發明所要解決的技術問題是正對上述存在的技術不足,提供一種利用知識本體技術構件個體,能夠對個體稿件進行自動審核,并返回審稿結果,大幅度降低人員工作強度,提高出版效率的基于本體的稿件自動審查方法。
本發明解決其技術問題所采用的技術方案是:
基于本體的稿件自動審查方法,其特征在于,包括有如下步驟:
選擇領域本體:根據稿件所屬領域選擇相應的領域本體模型,該模型是在其他領域模型系統中已經構建好的、包含類、對象屬性、數據屬性和規則信息的本體模型,而且相應的個體模型已經搭建好。
稿件預處理獲取構建詞表:在計算機系統中對稿件進行拆分處理,并對其中的文本信息使用分詞工具進行分詞且過濾掉沒有用的虛詞、助詞等停用詞后得到一個構建詞表,該詞表用于構建與稿件對應的個體模型,詞表保存有相應的位置信息。
稿件個體模型自動構建:稿件個體模型自動構建包括個體識別、數據屬性與對象屬性填充,具體實現分為以下幾個步驟:
個體識別:以根據所選領域模型類信息為參照標準類,在計算機系統中采用相應的分類算法或工具對構建詞表分類,計算其與參照標準類詞語的相似度,根據相似度閥值標識出構建詞表中的個體。
為個體填充數據屬性、對象屬性:將對應參照標準類下的個體名稱和數據屬性名稱、對象屬性名稱在構建詞表中進行匹配;使用相似度計算的方式匹配,匹配范圍是在與構建詞表中個體附近的詞語進行匹配;當匹配程度達到一個閾值時,將對應的文本數據標填充到數據屬性和對象屬性,并標識出該文本為相應屬性。
自動審稿:自動審稿包括數據屬性匹配、對象屬性匹配結果以及相應結果信息返回,返回信息作為審稿結果返回給用戶,具體實現如下:
數據屬性匹配:根據所選領域本體模型中與構建詞表匹配成功的個體的數據屬性與識別出的個體數據屬性進行匹配,匹配度達到一定閥值則匹配成功,否則匹配失敗返回個體信息數組(匹配類型即數據屬性匹配、個體信息即被參照個體與稿件個體信息、源信息即被參照數據屬性源信息與稿件數據屬性源信息)。
對象屬性匹配:根據所選領域本體模型中與構建詞表匹配成功的個體的對象屬性與識別出的個體對象屬性進行匹配,匹配度達到一定閥值則匹配成功,否則匹配失敗返回個體信息數組(匹配類型即對象屬性匹配、個體信息即被參照個體與稿件個體信息、源信息即被參照對象屬性源信息與稿件數據屬性源信息)。
匹配方法:根據所選領域本體模型中與詞庫匹配成功個體屬性為匹配標準,采用相似度計算方法或者工具計算對應屬性之間的相似度,當相似度達到一定閥值則匹配成功,低于閥值則匹配失敗。
返回信息處理:根據返回信息數組對邏輯有誤的地方標紅,且將信息編號返回給用戶查看。
本發明的原理是根據稿件所屬領域選擇相應的領域本體模型,以該模型為被參照本體模型;將作者的稿件進行一系列預處理獲得用于構建桿件個體模型的詞庫;通過個體識別、數據屬性與對象屬性填充構建稿件個體模型;然后通過對被參照模型與稿件個體模型的屬性匹配完成自動審稿并返回審稿結果信息。
本發明的有益效果是:
本發明方法利用知識本體技術構件個體,能夠對個體稿件進行自動審核,并返回審稿結果,大幅度降低人員工作強度,提高了出版效率。
附圖說明
圖1是本發明實施例的流程圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢理工大學;時代出版傳媒股份有限公司,未經武漢理工大學;時代出版傳媒股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510156543.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:網絡訂票的訂票請求訊號處理方法及系統
- 下一篇:一種河口區咸淡水比例測量方法
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





