[發(fā)明專利]一種基于文本的本體構(gòu)建方法及裝置有效
| 申請?zhí)枺?/td> | 202110069618.3 | 申請日: | 2021-01-19 |
| 公開(公告)號: | CN112733538B | 公開(公告)日: | 2023-05-30 |
| 發(fā)明(設(shè)計(jì))人: | 柳少峰;肖紅 | 申請(專利權(quán))人: | 廣東工業(yè)大學(xué) |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/253;G06F40/242;G06F40/216 |
| 代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 楊小紅 |
| 地址: | 510060 廣東省*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 文本 本體 構(gòu)建 方法 裝置 | ||
本申請公開了一種基于文本的本體構(gòu)建方法及裝置,方法包括:對預(yù)置文本語料庫中的每一個(gè)句子進(jìn)行分詞處理,并構(gòu)建詞典;基于預(yù)置概念提取法確定詞典中各詞語的詞語特征,并根據(jù)詞語特征和詞典確定概念集,詞語特征包括詞頻、詞頻?逆向文件頻率、關(guān)鍵詞和詞語?文檔數(shù);計(jì)算概念集中兩兩概念之間的關(guān)系強(qiáng)度,并根據(jù)關(guān)系強(qiáng)度確定關(guān)系類型;根據(jù)概念集和關(guān)系類型構(gòu)建本體概念關(guān)系圖。本申請解決了現(xiàn)有技術(shù)依賴于數(shù)據(jù)驅(qū)動(dòng)和人為驅(qū)動(dòng),導(dǎo)致PHM領(lǐng)域本體的構(gòu)建效率低,且缺乏客觀性、自動(dòng)性和完備性的技術(shù)問題。
技術(shù)領(lǐng)域
本申請涉及預(yù)測與健康管理技術(shù)領(lǐng)域,尤其涉及一種基于文本的本體構(gòu)建方法及裝置。
背景技術(shù)
預(yù)測與健康管理(Prognostics?HealthManagement,PHM)為一種設(shè)備系統(tǒng)的關(guān)鍵技術(shù),在系統(tǒng)設(shè)備運(yùn)行或工作狀態(tài)下,通過檢查與監(jiān)測運(yùn)行狀況,對故障進(jìn)行故障定位、故障規(guī)劃維修和供應(yīng)保障,從而減少或消除系統(tǒng)故障的發(fā)生,對降低系統(tǒng)故障率、降低企業(yè)運(yùn)營成本、提高設(shè)備生產(chǎn)效率有重要意義。
工業(yè)機(jī)器人作為一種復(fù)雜制造裝備系統(tǒng),其智能化水平在不斷提高,在工業(yè)生產(chǎn)、民用生活等方面發(fā)揮著重要作用。但是隨著工業(yè)機(jī)器人系統(tǒng)結(jié)構(gòu)復(fù)雜性日益增加,機(jī)器人的故障檢測、故障診斷、故障預(yù)測以及維修維護(hù)等工作難度也在不斷的增大。面向工業(yè)領(lǐng)域的機(jī)器人中任何部件或者零件發(fā)生故障,都將影響到整個(gè)系統(tǒng)的正常運(yùn)行,甚至造成災(zāi)難性的后果。
在現(xiàn)有技術(shù)中,基于數(shù)據(jù)驅(qū)動(dòng)的PHM方法無法獲取系統(tǒng)精確數(shù)學(xué)模型,較大程度的限制了PHM方法的實(shí)施;而且現(xiàn)有工業(yè)機(jī)器人PHM領(lǐng)域本體的構(gòu)建過程對研究人員存在依賴,導(dǎo)致領(lǐng)域本體構(gòu)建過程不客觀,且缺乏自動(dòng)性和完備性。
發(fā)明內(nèi)容
本申請?zhí)峁┝艘环N基于文本的本體構(gòu)建方法及裝置,用于解決現(xiàn)有技術(shù)依賴于數(shù)據(jù)驅(qū)動(dòng)和人為驅(qū)動(dòng),導(dǎo)致PHM領(lǐng)域本體的構(gòu)建效率低,且缺乏客觀性、自動(dòng)性和完備性的技術(shù)問題。
有鑒于此,本申請第一方面提供了一種基于文本的本體構(gòu)建方法,包括:
對預(yù)置文本語料庫中的每一個(gè)句子進(jìn)行分詞處理,并構(gòu)建詞典;
基于預(yù)置概念提取法確定所述詞典中各詞語的詞語特征,并根據(jù)所述詞語特征和所述詞典確定概念集,所述詞語特征包括詞頻、詞頻-逆向文件頻率、關(guān)鍵詞和詞語-文檔數(shù);
計(jì)算所述概念集中兩兩概念之間的關(guān)系強(qiáng)度,并根據(jù)所述關(guān)系強(qiáng)度確定關(guān)系類型;
根據(jù)所述概念集和所述關(guān)系類型構(gòu)建本體概念關(guān)系圖。
優(yōu)選地,所述對預(yù)置文本語料庫中的每一個(gè)句子進(jìn)行分詞處理,并構(gòu)建詞典,之前還包括:
采用預(yù)置工具爬取初始文本信息,得到初始文本集合;
將所述初始文本集合根據(jù)預(yù)置過濾規(guī)則進(jìn)行過濾,得到預(yù)置文本語料庫。
優(yōu)選地,所述對預(yù)置文本語料庫中的每一個(gè)句子進(jìn)行分詞處理,并構(gòu)建詞典,包括:
通過預(yù)置分詞工具根據(jù)預(yù)設(shè)詞典對預(yù)置文本語料庫中的每一個(gè)句子進(jìn)行分詞處理,得到多個(gè)詞語,并根據(jù)所述詞語構(gòu)建為詞典。
優(yōu)選地,所述預(yù)置概念提取法包括詞頻統(tǒng)計(jì)法、TF-IDF算法、TextRank算法和詞語文檔統(tǒng)計(jì)法;相應(yīng)的,所述基于預(yù)置概念提取法確定所述詞典中各詞語的詞語特征,并根據(jù)所述詞語特征和所述詞典確定概念集,包括:
采用所述詞頻統(tǒng)計(jì)法統(tǒng)計(jì)所述詞典中各個(gè)詞語的初始詞頻;
采用所述TF-IDF算法計(jì)算所述詞典中各個(gè)詞語的初始詞頻-逆向文件頻率;
采用所述TextRank算法抽取所述詞典中的初始關(guān)鍵詞;
采用所述詞語文檔統(tǒng)計(jì)法統(tǒng)計(jì)所述詞典中包括同一個(gè)詞語的文檔數(shù)量,得到初始詞語-文檔數(shù);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東工業(yè)大學(xué),未經(jīng)廣東工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110069618.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 構(gòu)建墊、實(shí)體圖像構(gòu)建物和構(gòu)建構(gòu)建物支撐件的方法
- 支持松耦合的軟件構(gòu)建方法、系統(tǒng)及該系統(tǒng)的實(shí)現(xiàn)方法
- 版本的構(gòu)建系統(tǒng)及方法
- 工程構(gòu)建系統(tǒng)及其構(gòu)建方法
- 實(shí)例構(gòu)建方法、裝置及軟件系統(tǒng)
- 軟件構(gòu)建方法、軟件構(gòu)建裝置和軟件構(gòu)建系統(tǒng)
- 天花板地圖構(gòu)建方法、構(gòu)建裝置以及構(gòu)建程序
- 一種項(xiàng)目構(gòu)建方法、持續(xù)集成系統(tǒng)及終端設(shè)備
- 并行構(gòu)建的方法、裝置及設(shè)備
- 構(gòu)建肺癌預(yù)測模型構(gòu)建方法





