[發明專利]建筑信息模型自適應的中文分詞方法及裝置在審
| 申請號: | 201911404637.6 | 申請日: | 2019-12-30 |
| 公開(公告)號: | CN111178051A | 公開(公告)日: | 2020-05-19 |
| 發明(設計)人: | 周小平;張鑫;王佳 | 申請(專利權)人: | 盈嘉互聯(北京)科技有限公司;盈嘉互聯(上海)建筑科技有限公司;嘉興烏鎮盈嘉千鎮科技有限公司;深圳前海盈嘉數據服務有限公司;深圳市盈嘉互聯科技有限公司 |
| 主分類號: | G06F40/247 | 分類號: | G06F40/247;G06F40/284 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 張秀程 |
| 地址: | 100041 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 建筑 信息 模型 自適應 中文 分詞 方法 裝置 | ||
1.一種建筑信息模型自適應的中文分詞方法,其特征在于,包括:
根據目標BIM模型構建BIM模型詞典;
在預先訓練好的中文分詞模型中嵌入預先構建的建筑領域術語詞典和所述BIM模型詞典;
基于嵌入所述BIM模型詞典和建筑領域術語詞典后的中文分詞模型對建筑領域待分詞語句進行分詞。
2.根據權利要求1所述的建筑信息模型自適應的中文分詞方法,其特征在于,根據目標BIM模型構建BIM模型詞典的步驟包括:
從目標BIM模型的各IFC對象中篩選出含有建筑項目的特征信息的屬性;
根據所述屬性構建項目特征信息模型;其中,所述項目特征信息模型中的屬性在不同的IFC對象中含有的建筑項目的特征信息不同;
根據所述項目特征信息模型構建所述BIM模型詞典。
3.根據權利要求1所述的建筑信息模型自適應的中文分詞方法,其特征在于,在預先訓練好的中文分詞模型中嵌入預先構建的建筑領域術語詞典和所述BIM模型詞典的步驟包括:
基于雙數組Trie樹的詞典嵌入算法,在預先訓練好的中文分詞模型中嵌入預先構建的建筑領域術語詞典和所述BIM模型詞典。
4.根據權利要求3所述的建筑信息模型自適應的中文分詞方法,其特征在于,基于雙數組Trie樹的詞典嵌入算法,在預先訓練好的中文分詞模型中嵌入預先構建的建筑領域術語詞典和所述BIM模型詞典的步驟包括:
構建所述建筑領域術語詞典的Tire樹和所述BIM模型詞典的Tire樹;
根據所述建筑領域術語詞典的Tire樹構建所述建筑領域術語詞典的雙數組,根據所述BIM模型詞典的Tire樹構建所述BIM模型詞典的雙數組;
將所述建筑領域術語詞典的雙數組和所述BIM模型詞典的雙數組添加到訓練好的所述中文分詞模型中。
5.根據權利要求1所述的建筑信息模型自適應的中文分詞方法,其特征在于,基于嵌入所述BIM模型詞典和建筑領域術語詞典后的中文分詞模型對建筑領域待分詞語句進行分詞的步驟包括:
基于嵌入所述BIM模型詞典和建筑領域術語詞典前的中文分詞模型對建筑領域待分詞語句進行分詞,獲取初始分詞結果;
基于嵌入所述BIM模型詞典和建筑領域術語詞典后的中文分詞模型中的建筑領域術語詞典對所述分詞結果進行優化,獲取優化后的初始分詞結果;
基于嵌入所述BIM模型詞典和建筑領域術語詞典后的中文分詞模型中的BIM模型詞典對優化后的初始分詞結果進行再次優化,獲取再次優化后的初始分詞結果。
6.根據權利要求1-5任一所述的建筑信息模型自適應的中文分詞方法,其特征在于,在預先訓練好的中文分詞模型中嵌入預先構建的建筑領域術語詞典和所述BIM模型詞典的步驟之前還包括:
基于HMM方法或CRF方法對所述中文分詞模型進行訓練。
7.根據權利要求1-5任一所述的建筑信息模型自適應的中文分詞方法,其特征在于,在預先訓練好的中文分詞模型中嵌入預先構建的建筑領域術語詞典和所述BIM模型詞典的步驟之前還包括:
從建筑領域專業知識庫中篩選出建筑領域的術語詞組;
根據所述術語詞組構建所述建筑領域術語詞典。
8.一種建筑信息模型自適應的中文分詞裝置,其特征在于,包括:
構建模塊,用于根據目標BIM模型構建BIM模型詞典;
嵌入模塊,用于在預先訓練好的中文分詞模型中嵌入預先構建的建筑領域術語詞典和所述BIM模型詞典;
分詞模塊,用于基于嵌入所述BIM模型詞典和建筑領域術語詞典后的中文分詞模型對建筑領域待分詞語句進行分詞。
9.一種電子設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述程序時實現如權利要求1至7任一項所述建筑信息模型自適應的中文分詞方法的步驟。
10.一種非暫態計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該計算機程序被處理器執行時實現如權利要求1至7任一項所述建筑信息模型自適應的中文分詞方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于盈嘉互聯(北京)科技有限公司;盈嘉互聯(上海)建筑科技有限公司;嘉興烏鎮盈嘉千鎮科技有限公司;深圳前海盈嘉數據服務有限公司;深圳市盈嘉互聯科技有限公司,未經盈嘉互聯(北京)科技有限公司;盈嘉互聯(上海)建筑科技有限公司;嘉興烏鎮盈嘉千鎮科技有限公司;深圳前海盈嘉數據服務有限公司;深圳市盈嘉互聯科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911404637.6/1.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





