[發(fā)明專(zhuān)利]建筑信息模型自適應(yīng)的中文分詞方法及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201911404637.6 | 申請(qǐng)日: | 2019-12-30 |
| 公開(kāi)(公告)號(hào): | CN111178051A | 公開(kāi)(公告)日: | 2020-05-19 |
| 發(fā)明(設(shè)計(jì))人: | 周小平;張?chǎng)?/a>;王佳 | 申請(qǐng)(專(zhuān)利權(quán))人: | 盈嘉互聯(lián)(北京)科技有限公司;盈嘉互聯(lián)(上海)建筑科技有限公司;嘉興烏鎮(zhèn)盈嘉千鎮(zhèn)科技有限公司;深圳前海盈嘉數(shù)據(jù)服務(wù)有限公司;深圳市盈嘉互聯(lián)科技有限公司 |
| 主分類(lèi)號(hào): | G06F40/247 | 分類(lèi)號(hào): | G06F40/247;G06F40/284 |
| 代理公司: | 北京路浩知識(shí)產(chǎn)權(quán)代理有限公司 11002 | 代理人: | 張秀程 |
| 地址: | 100041 北京市海淀區(qū)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 建筑 信息 模型 自適應(yīng) 中文 分詞 方法 裝置 | ||
本發(fā)明實(shí)施例提供一種建筑信息模型自適應(yīng)的中文分詞方法及裝置,方法包括:根據(jù)目標(biāo)BIM模型構(gòu)建BIM模型詞典;在預(yù)先訓(xùn)練好的中文分詞模型中嵌入預(yù)先構(gòu)建的建筑領(lǐng)域術(shù)語(yǔ)詞典和所述BIM模型詞典;基于嵌入所述BIM模型詞典和建筑領(lǐng)域術(shù)語(yǔ)詞典后的中文分詞模型對(duì)建筑領(lǐng)域待分詞語(yǔ)句進(jìn)行分詞。本發(fā)明實(shí)施例在需要對(duì)BIM模型進(jìn)行數(shù)據(jù)挖掘時(shí),有針對(duì)性地使用該BIM模型中實(shí)際用到的特征信息對(duì)中文分詞模型進(jìn)行優(yōu)化,使得分詞結(jié)果更適用于該BIM模型的數(shù)據(jù)挖掘,實(shí)現(xiàn)了BIM模型自適應(yīng)的中文分詞,提高了建筑信息領(lǐng)域中文分詞的效率和準(zhǔn)確性,有助于提升現(xiàn)有BIM模型檢索、實(shí)體匹配等方法的普適性,擴(kuò)大其應(yīng)用范圍。
技術(shù)領(lǐng)域
本發(fā)明屬于自然語(yǔ)言處理技術(shù)領(lǐng)域,尤其涉及一種建筑信息模型自適應(yīng)的中文分詞方法及裝置。
背景技術(shù)
建筑信息模型(Building Information Modeling,BIM)是記錄建筑設(shè)施物理特性和功能特性的數(shù)字信息模型。BIM包含了建筑全生命周期中各階段的詳細(xì)信息,實(shí)現(xiàn)了建筑生命周期數(shù)據(jù)的互操作性,促進(jìn)了建筑工程各參與方的有效協(xié)同。當(dāng)前,BIM已成為建筑行業(yè)(Architecture,Engineering and Construction,AEC)工程信息化的有效解決方案和重要趨勢(shì),并在建筑企業(yè)中得到了廣泛的研究和應(yīng)用實(shí)踐。
通常,一個(gè)BIM模型記錄一個(gè)工程項(xiàng)目完整的數(shù)據(jù)信息。當(dāng)前針對(duì)BIM的研究大多針對(duì)某一個(gè)或多個(gè)BIM模型展開(kāi)。為提升BIM模型的應(yīng)用效率,部分學(xué)者開(kāi)展了面向BIM模型的信息檢索、實(shí)體匹配等研究。這些研究的性能直接受分詞效果的影響。分詞是指將文本序列分割成多個(gè)單詞,是許多BIM數(shù)據(jù)挖掘處理的基礎(chǔ)和首要步驟。好的分詞將能提升模型級(jí)信息檢索、實(shí)體匹配等方法的效率,增加此類(lèi)方法的普適性,并擴(kuò)大其應(yīng)用范疇。
例如,當(dāng)檢索“五層?xùn)|北強(qiáng)電間的雙擊雙控開(kāi)關(guān)”時(shí),若能正確將檢索內(nèi)容分詞為“五層”、“東北強(qiáng)電間”、“的”和“雙擊雙控開(kāi)關(guān)”,則有助于信息檢索系統(tǒng)快速、準(zhǔn)確地定位到BIM模型中對(duì)應(yīng)的構(gòu)件。然而,當(dāng)前主流分詞方法的分詞準(zhǔn)確率受訓(xùn)練語(yǔ)料和應(yīng)用領(lǐng)域的影響,很難直接應(yīng)用于信息檢索和實(shí)體匹配等基于BIM的項(xiàng)目級(jí)數(shù)據(jù)挖掘研究。例如,當(dāng)前主流分詞方法的分詞結(jié)果為“五層”、“東北”、“強(qiáng)”、“電間”、“的”、“雙擊”、“雙控”和“開(kāi)關(guān)”,或者為“五層”、“東北”、“強(qiáng)電間”、“的”、“雙擊”和“雙控開(kāi)關(guān)”。雖然,部分學(xué)者開(kāi)展了面向建筑領(lǐng)域的分詞方法研究,然而,其在特定BIM模型中的適應(yīng)性較差。
發(fā)明內(nèi)容
為克服上述現(xiàn)有的中文分詞方法的分詞結(jié)果不能直接應(yīng)用于BIM模型的數(shù)據(jù)挖掘,且適應(yīng)性差的問(wèn)題或者至少部分地解決上述問(wèn)題,本發(fā)明實(shí)施例提供一種建筑信息模型自適應(yīng)的中文分詞方法及裝置。
根據(jù)本發(fā)明實(shí)施例的第一方面,提供一種建筑信息模型自適應(yīng)的中文分詞方法,包括:
根據(jù)目標(biāo)BIM模型構(gòu)建BIM模型詞典;
在預(yù)先訓(xùn)練好的中文分詞模型中嵌入預(yù)先構(gòu)建的建筑領(lǐng)域術(shù)語(yǔ)詞典和所述BIM模型詞典;
基于嵌入所述BIM模型詞典和建筑領(lǐng)域術(shù)語(yǔ)詞典后的中文分詞模型對(duì)建筑領(lǐng)域待分詞語(yǔ)句進(jìn)行分詞。
具體地,根據(jù)目標(biāo)BIM模型構(gòu)建BIM模型詞典的步驟包括:
從目標(biāo)BIM模型的各IFC對(duì)象中篩選出含有建筑項(xiàng)目的特征信息的屬性;
根據(jù)所述屬性構(gòu)建項(xiàng)目特征信息模型;其中,所述項(xiàng)目特征信息模型中的屬性在不同的IFC對(duì)象中含有的建筑項(xiàng)目的特征信息不同;
根據(jù)所述項(xiàng)目特征信息模型構(gòu)建所述BIM模型詞典。
具體地,在預(yù)先訓(xùn)練好的中文分詞模型中嵌入預(yù)先構(gòu)建的建筑領(lǐng)域術(shù)語(yǔ)詞典和所述BIM模型詞典的步驟包括:
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于盈嘉互聯(lián)(北京)科技有限公司;盈嘉互聯(lián)(上海)建筑科技有限公司;嘉興烏鎮(zhèn)盈嘉千鎮(zhèn)科技有限公司;深圳前海盈嘉數(shù)據(jù)服務(wù)有限公司;深圳市盈嘉互聯(lián)科技有限公司,未經(jīng)盈嘉互聯(lián)(北京)科技有限公司;盈嘉互聯(lián)(上海)建筑科技有限公司;嘉興烏鎮(zhèn)盈嘉千鎮(zhèn)科技有限公司;深圳前海盈嘉數(shù)據(jù)服務(wù)有限公司;深圳市盈嘉互聯(lián)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911404637.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置
- 使用后向自適應(yīng)規(guī)則進(jìn)行整數(shù)數(shù)據(jù)的無(wú)損自適應(yīng)Golomb/Rice編碼和解碼
- 一種自適應(yīng)軟件UML建模及其形式化驗(yàn)證方法
- 媒體自適應(yīng)參數(shù)的調(diào)整方法、系統(tǒng)及相關(guān)設(shè)備
- 五自由度自適應(yīng)位姿調(diào)整平臺(tái)
- 采用自適應(yīng)機(jī)匣和自適應(yīng)風(fēng)扇的智能發(fā)動(dòng)機(jī)
- 一種自適應(yīng)樹(shù)木自動(dòng)涂白裝置
- 一種基于微服務(wù)的多層次自適應(yīng)方法
- 一種天然氣發(fā)動(dòng)機(jī)燃?xì)庾赃m應(yīng)控制方法及系統(tǒng)
- 一種中心自適應(yīng)的焊接跟蹤機(jī)頭
- 一種有砟軌道沉降自適應(yīng)式軌道系統(tǒng)





