[發明專利]基于文字相似性的工程文件數據自適應匹配的方法及設備在審
| 申請號: | 202310092269.6 | 申請日: | 2023-02-06 |
| 公開(公告)號: | CN116340589A | 公開(公告)日: | 2023-06-27 |
| 發明(設計)人: | 孫蘇勇;金季嵐;高磊 | 申請(專利權)人: | 廈門海邁科技股份有限公司 |
| 主分類號: | G06F16/903 | 分類號: | G06F16/903;G06Q10/10;G06Q50/08;G06F40/194 |
| 代理公司: | 北京科家知識產權代理事務所(普通合伙) 11427 | 代理人: | 莊吳敏 |
| 地址: | 361008 福建省廈門*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 文字 相似性 工程 文件 數據 自適應 匹配 方法 設備 | ||
本申請公開了基于文字相似性的工程文件數據自適應匹配的方法,包括:獲取步驟,獲取原工序中的目標規范表格名稱;提取步驟,在所述目標規范表格名稱中提取待比對字符串;匹配步驟,通過預設算法,匹配與所述待比對字符串相似度最高的結果表格。在工程文件提交電子簽章時,檢索簽章漏項;獲取所述簽章漏項的流程選項字符串;通過所述預設算法,匹配與所述流程選項字符串相似度最高的結果表格,所述結果表格中設有章位描述。在建設工程文件編制中,利用對特定領域數據的分析,通過相似度匹配的方法進行工序數據的生成及簽章與流程的漏項適配。
技術領域
本申請涉及數字化信息技術領域,尤其涉及一種基于文字相似性的建設工程資料工序、簽章流程自適應匹配方法及系統。
背景技術
在建設工程資料的編制過程中,為方便專業人員進行編制,根據不同工程專業的不同要求,系統會提供基于專業的一些常用工序,不同工序需與不同規范的相關模板表格進行關聯設置,以實現依照工序進行表格的創建和編制。
另外,在建設工程資料提交電子簽章時,同樣需要根據表格設定內容進行簽章流程的生成,盡管依靠人工及各類規則可以準確生成大部分簽章位及相關流程,但仍會存在遺漏,比如在跨地域的工序生成時出現工序錯漏,以及,因流程不匹配的簽章無法正常生成等情況。
從而,現有技術至少存在如下技術缺點:建設工序和簽章流程無法適應遷移變更的需求。
發明內容
本申請實施例提供一種基于文字相似性的建設工程資料工序、簽章流程自適應匹配方法及系統,實現建設工序和簽章流程適應遷移變更的需求。
一種基于文字相似性的工程文件數據自適應匹配的方法,包括:
獲取步驟,獲取原工序中的目標規范表格名稱;
提取步驟,在所述目標規范表格名稱中提取待比對字符串;
匹配步驟,通過預設算法,匹配與所述待比對字符串相似度最高的結果表格。
優選地,本方法還包括:
獲取原工序所在的工序樹狀圖;
所述預設算法具體配置為:采集所述工序樹狀圖中,與所述原工序位置對應的字符串數據集,在該字符串數據集中進行匹配。
優選地,本方法還包括:
在工程文件提交電子簽章時,檢索簽章漏項;
獲取所述簽章漏項的流程選項字符串;
通過所述預設算法,匹配與所述流程選項字符串相似度最高的結果表格,所述結果表格中設有章位描述。
優選地,所述預設算法為編輯距離及詞向量相似度的相似度算法。
優選地,所述相似度算法具體實現為:
獲取待比對的字符串;
對字符串進行給予替換或轉換詞向量的預處理;
計算相似度并取最大項;
計算相似度是否達標,針對達標的目標表格進行匹配后的處理和輸出。
優選地,本方法包括:針對待比對的兩個字符串,賦予字符串對應詞向量不同權重。
優選地,所述匹配后的處理包括:表格關聯和/或章位設置。
一種基于文字相似性的工程文件數據自適應匹配的裝置,包括:上述基于文字相似性的工程文件數據自適應匹配的方法。
一種基于文字相似性的工程文件數據自適應匹配的系統,包括:上述基于文字相似性的工程文件數據自適應匹配的裝置。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門海邁科技股份有限公司,未經廈門海邁科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310092269.6/2.html,轉載請聲明來源鉆瓜專利網。





