[發明專利]一種施工案例知識重用查詢方法及其裝置在審
| 申請號: | 202110313320.2 | 申請日: | 2021-03-24 |
| 公開(公告)號: | CN112949304A | 公開(公告)日: | 2021-06-11 |
| 發明(設計)人: | 鄧逸川;鄧暉;蘇成;王煜;宋建煒 | 申請(專利權)人: | 中新國際聯合研究院 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/216;G06K9/62;G06N3/04;G06N3/08;G06Q10/10 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 李盛洪 |
| 地址: | 510000 廣東省廣州市廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 施工 案例 知識 重用 查詢 方法 及其 裝置 | ||
本發明公開了一種施工案例知識重用查詢方法及其裝置,所述方法包括以下步驟:收集施工安全規范文檔以及施工安全事故報告,并將這些資料電子化,建立施工安全領域案例庫;基于自然語言處理技術對施工安全規范文檔以及施工安全事故報告進行文本分詞及去停用詞的處理,再通過詞頻逆文本算法計算特征詞;通過自建的建筑行業常用術語詞庫及連續詞袋模型,進行特征詞的同義詞擴展查詢;基于向量空間模型及余弦函數改進方法進行相似施工安全案例的相似度計算;將整個數據庫及查詢系統集成到本地服務器或者智能設備中;本發明可以將以往施工安全案例知識復用為新風險提供決策幫助,將會大大提高施工安全管理的水平,同時節約查詢時間,提高查詢效率。
技術領域
本發明涉及施工案例知識管理技術領域,特別涉及一種基于自然語言處理技術的施工案例知識重用查詢方法及其裝置。
背景技術
改革開放以來,我國加大了工程項目的開發力度。工程項目的建設,本身是一種多門類的綜合性生產活動,工程項目建設周期較長,在建設過程中,具有許多不確定因素。
近年來,我國建筑施工安全形勢雖然有所好轉,但各類安全事故時有發生,施工安全問題仍不容忽視,施工安全管理水平仍需進一步提高。然而由于土木行業零碎化信息及可變因素多,雖然施工安全事故報告在不斷積累,但在傳統的施工安全管理中并不能充分利用這些信息,其原因在于缺乏將這些信息轉化為可復用知識的手段,如果建立一個施工案例知識重用查詢系統,通過以往施工安全案例知識復用為新風險提供決策幫助,將會大大提高施工安全管理的水平。
當前關于施工案例主要集中在住建部網站的事故安全報告及新聞報告中,在這些非結構化文本中查詢相似施工安全案例效率低下,所以在施工安全案例重用領域仍存在很大的空缺。
發明內容
本發明的目的在于克服現有技術中的上述缺陷,提供一種施工案例知識重用查詢方法及其裝置,該方法和裝置可以將以往施工安全案例知識復用為新風險提供決策幫助,將會大大提高施工安全管理的水平,同時節約查詢時間,提高查詢效率。
為實現上述目的,本發明提供了一種施工案例知識重用查詢方法,包括以下步驟:
步驟S1,收集施工安全規范文檔以及施工安全事故報告,并將這些資料電子化,建立施工安全領域案例庫;
步驟S2,基于自然語言處理技術對施工安全規范文檔以及施工安全事故報告進行文本分詞及去停用詞的處理,再通過詞頻逆文本算法計算特征詞;
步驟S3,通過自建的建筑行業常用術語詞庫及連續詞袋模型,進行特征詞的同義詞擴展查詢;
步驟S4,基于向量空間模型及余弦函數改進方法進行相似施工安全案例的相似度計算;
步驟S5,將整個數據庫及查詢系統集成到本地服務器或者智能設備中。
作為優選的,所述步驟S2中包括以下步驟:
步驟S21,通過jieba將施工安全事故案例進行分詞處理,所述jieba分詞使用前綴樹對詞語進行分類,用于提高檢索的效率;
步驟S22,通過自建停用詞庫去掉施工安全事故案例文本中存在的虛詞,所述停用詞為極其常見詞,對幫助計算文本的相似度沒有什么價值,刪除那些無意義的字詞可以大大減少庫的大小并提高檢索效率;
步驟S23,通過算法比選,選取詞頻逆文本算法進行特征詞的提取,并進行特征詞的權重計算,提取施工安全事故案例中的特征詞。
作為優選的,所述步驟S23中包括以下步驟:
步驟S231,在詞頻的基礎上根據詞語的重要性計算權重,這個權重叫“逆文本頻率”,大小與詞語的常見程度成反比;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中新國際聯合研究院,未經中新國際聯合研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110313320.2/2.html,轉載請聲明來源鉆瓜專利網。





