[發(fā)明專利]一種基于文本的元器件識別方法、系統(tǒng)、裝置和存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201811041889.2 | 申請日: | 2018-09-07 |
| 公開(公告)號: | CN109446885B | 公開(公告)日: | 2022-03-15 |
| 發(fā)明(設(shè)計(jì))人: | 吳賀揚(yáng);詹建州;趙引;孫爾安 | 申請(專利權(quán))人: | 廣州算易軟件科技有限公司 |
| 主分類號: | G06V30/422 | 分類號: | G06V30/422;G06V10/774;G06V10/764;G06V10/82;G06K9/62;G06N3/04 |
| 代理公司: | 廣州嘉權(quán)專利商標(biāo)事務(wù)所有限公司 44205 | 代理人: | 胡輝 |
| 地址: | 510220 廣東省廣州市*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 文本 元器件 識別 方法 系統(tǒng) 裝置 存儲 介質(zhì) | ||
本發(fā)明公開了一種基于文本的元器件識別方法、系統(tǒng)、裝置和存儲介質(zhì),該方法包括以下步驟:獲取待識別的電氣圖紙;對待識別的電氣圖紙進(jìn)行預(yù)處理,獲取待識別的文本;根據(jù)待識別的文本的結(jié)構(gòu)和內(nèi)容,計(jì)算待識別的文本屬于各類元器件的第一概率;根據(jù)待識別的文本屬于各類元器件的第一概率,得到第一識別結(jié)果。本發(fā)明從電氣圖紙中提取待識別的文本,然后根據(jù)待識別的文本的結(jié)構(gòu)和內(nèi)容,計(jì)算待識別的文本屬于各類元器件的第一概率,并根據(jù)第一概率來獲得第一識別結(jié)果,本發(fā)明基于概率統(tǒng)計(jì)的方式從電氣圖紙中識別文本所屬于的元器件類型,可以克服傳統(tǒng)數(shù)據(jù)庫查詢方式存在的問題,具有較強(qiáng)的泛化能力。本發(fā)明可以廣泛應(yīng)用于人工智能領(lǐng)域。
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能領(lǐng)域,尤其是一種基于文本的元器件識別方法、系統(tǒng)、裝置和存儲介質(zhì)。
背景技術(shù)
在電氣行業(yè),報(bào)價(jià)員需要根據(jù)從客戶拿到的CAD電氣設(shè)計(jì)圖紙列出元器件的清單。列清單是成套電氣報(bào)價(jià)中最重要的一個環(huán)節(jié),是成套電氣報(bào)價(jià)的基礎(chǔ)。作為一個枯燥又繁瑣,但是又要求報(bào)價(jià)員具有一定專業(yè)知識的環(huán)節(jié),傳統(tǒng)的成套電氣報(bào)價(jià)方式主要是通過手工輸入Excel的方式或者用軟件的方式把元器件文本扒取出來,并由人工填寫出對應(yīng)的元器件類型,匯總出報(bào)價(jià)清單,最后報(bào)價(jià)員根據(jù)這樣的清單進(jìn)行報(bào)價(jià)。其中,在列清單的過程中,這些元器件文本的元器件類型一般是報(bào)價(jià)員根據(jù)自身的背景知識,通過元器件文本內(nèi)容及對應(yīng)的元器件圖形綜合來判斷的。這種只能通過手工列清單的方式,在操作上機(jī)械繁瑣,效率相當(dāng)?shù)拖拢艽蟪潭壬线€要依賴于“人”,很容易出錯,這樣的解決方案極大程度上受限于報(bào)價(jià)員報(bào)價(jià)的速度與精度,不能滿足用戶及公司的對快速精準(zhǔn)報(bào)價(jià)方面要求,也影響了工程的進(jìn)度,嚴(yán)重的甚至可能導(dǎo)致企業(yè)競標(biāo)失敗或虧損。伴隨著人工智能大潮的到來,針對成套電氣報(bào)價(jià)領(lǐng)域,通過人工智能的方式去識別圖紙是必由之路。
在電氣行業(yè),電氣圖紙中元器件的智能識別,一般是由兩個方面構(gòu)成的,一個是元器件文本的識別,另一個是元器件圖形的識別。目前,元器件文本的判斷和識別很大程度上還是依賴于數(shù)據(jù)庫的查詢,這種方式泛化能力太差,如一條雙電源文本“WATSG-100/4”由于設(shè)計(jì)師手誤,寫成了“WTASG-100/4”,就不能做到查詢到。
發(fā)明內(nèi)容
為解決上述技術(shù)問題,本發(fā)明的目的在于:提供一種泛化能力強(qiáng)的基于文本的元器件識別方法、系統(tǒng)、裝置和存儲介質(zhì)。
本發(fā)明所采取的第一種技術(shù)方案是:
一種基于文本的元器件識別方法,包括以下步驟:
獲取待識別的電氣圖紙;
對待識別的電氣圖紙進(jìn)行預(yù)處理,獲取待識別的文本;
根據(jù)待識別的文本的結(jié)構(gòu)和內(nèi)容,計(jì)算待識別的文本屬于各類元器件的第一概率;
根據(jù)待識別的文本屬于各類元器件的第一概率,得到第一識別結(jié)果。
進(jìn)一步,所述第一概率的計(jì)算公式為:
其中,P(C=Ci)表示待識別的文本屬于第i類元器件的概率,m表示待識別的文本的分詞數(shù)量,Nj表示標(biāo)注文本庫中與待識別的文本在第j個詞語的位置上內(nèi)容匹配的文本數(shù)量;Mj表示標(biāo)注文本庫中與待識別的文本的第j個詞語內(nèi)容匹配但位置不同的文本數(shù)量;Nij表示標(biāo)注文本庫中屬于第i類元器件且與待識別的文本在第j個詞語的位置上內(nèi)容匹配的文本數(shù)量;Mij表示標(biāo)注文本庫中屬于第i類元器件且與待識別的文本的第j個詞語內(nèi)容匹配但位置不同的文本數(shù)量,λ表示第一權(quán)重系數(shù),ωj表示第二權(quán)重系數(shù)。
進(jìn)一步,所述對待識別的電氣圖紙進(jìn)行預(yù)處理,獲取待識別的文本,這一步驟具體包括:
從待識別的電氣圖紙中提取文本內(nèi)容;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州算易軟件科技有限公司,未經(jīng)廣州算易軟件科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811041889.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲介質(zhì)
- 文本生成方法、裝置和電子設(shè)備





