[發(fā)明專利]一種危險(xiǎn)化學(xué)品領(lǐng)域的知識(shí)表示方法在審
| 申請?zhí)枺?/td> | 202010440437.2 | 申請日: | 2020-05-22 |
| 公開(公告)號(hào): | CN111613277A | 公開(公告)日: | 2020-09-01 |
| 發(fā)明(設(shè)計(jì))人: | 李學(xué)明;林智勇 | 申請(專利權(quán))人: | 重慶大學(xué) |
| 主分類號(hào): | G16C20/20 | 分類號(hào): | G16C20/20;G16C20/30;G16C20/70;G06F16/36 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 400044 *** | 國省代碼: | 重慶;50 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 危險(xiǎn) 化學(xué)品 領(lǐng)域 知識(shí) 表示 方法 | ||
1.一種危險(xiǎn)化學(xué)品領(lǐng)域的知識(shí)表示方法,其特征在于:包括以下步驟:
步驟1:按照《危險(xiǎn)化學(xué)品目錄(2015版)》確定所需的目標(biāo)危險(xiǎn)化學(xué)品,然后到網(wǎng)站上爬取其相關(guān)信息,包括了CAS號(hào)、SMILES表達(dá)式、理化性質(zhì)、不相容化學(xué)品、儲(chǔ)存運(yùn)輸方式等,將上述爬取的相關(guān)數(shù)據(jù)存儲(chǔ)至mysql數(shù)據(jù)庫中。
步驟2:提取出危險(xiǎn)化學(xué)品基本性質(zhì)知識(shí)。對每一個(gè)化學(xué)品,對其進(jìn)行SMILES表達(dá)式的解析,將其分解為數(shù)個(gè)原子、離子和化學(xué)基團(tuán)。將化學(xué)品、SMILES表達(dá)式、每一個(gè)不同的原子、離子和化學(xué)基團(tuán)均定義為一個(gè)實(shí)體,再利用SMILES表達(dá)式,找出這些實(shí)體之間的關(guān)系。將所有的實(shí)體和關(guān)系組合成三元組信息保存在數(shù)據(jù)庫中。
步驟3:人工錄入所有危險(xiǎn)化學(xué)品之間的不相容性質(zhì)知識(shí)。具體包括兩個(gè)不相容實(shí)體和實(shí)體之間的不相容關(guān)系,將所有的不相容信息組合成三元組信息保存在數(shù)據(jù)庫中。
步驟4:提取危險(xiǎn)化學(xué)品其他性質(zhì)知識(shí)。將數(shù)據(jù)庫中每一條記錄中的每一個(gè)字段均定義為一個(gè)實(shí)體,將化學(xué)品相關(guān)信息表的列屬性名均定義為一個(gè)關(guān)系,將所有的實(shí)體和關(guān)系組合成三元組信息保存在數(shù)據(jù)庫中。
步驟5:構(gòu)建并應(yīng)用ChIncomTrans知識(shí)表示模型。從數(shù)據(jù)庫中提取所有的三元組信息,使用ChIncomTrans模型將每個(gè)實(shí)體和關(guān)系都映射到低維向量空間中,使用模型將其均表示為向量形式的存在,從而完成了知識(shí)表示的過程。
2.根據(jù)權(quán)利要求1所述的一種危險(xiǎn)化學(xué)品領(lǐng)域的知識(shí)表示方法,其特征在于步驟2中,其對每一個(gè)化學(xué)式的SMILES表達(dá)式解析的具體步驟為:
步驟2.1:解析SMILES表達(dá)式中包含的原子與離子。將化學(xué)品作為一個(gè)實(shí)體,解析出的原子或者離子作為另一個(gè)實(shí)體,實(shí)體間關(guān)系定義為“包含原子”或“包含離子”,將三元組保存在數(shù)據(jù)庫中。
步驟2.2:解析SMILES表達(dá)式中包含的化學(xué)基團(tuán),將化學(xué)品作為一個(gè)實(shí)體,化學(xué)基團(tuán)作為另一個(gè)實(shí)體,實(shí)體間關(guān)系定義為“包含基團(tuán)”,將三元組保存在數(shù)據(jù)庫中。
步驟2.3:解析SMILES表達(dá)式中包含的非單鍵化學(xué)式。將化學(xué)品作為一個(gè)實(shí)體,非單鍵化學(xué)式實(shí)體作為另一個(gè)實(shí)體,實(shí)體間關(guān)系定義為“包含非單鍵化學(xué)式”,將三元組保存在數(shù)據(jù)庫中。
步驟2.4:解析SMILES表達(dá)式中包含的單鍵化學(xué)式及位置信息。先將化學(xué)品作為一個(gè)實(shí)體,單鍵化學(xué)式實(shí)體作為另一個(gè)實(shí)體,實(shí)體間關(guān)系定義為“包含非單鍵化學(xué)式”,將三元組保存在數(shù)據(jù)庫中。再將解析出的單鍵化學(xué)式按照在SMILES表達(dá)式中出現(xiàn)的順序進(jìn)行編號(hào),對兩兩間距為dis的單鍵化學(xué)式進(jìn)行三元組的添加:將編號(hào)較小的化學(xué)式定義為一個(gè)實(shí)體,編號(hào)較大的化學(xué)式定義為另一個(gè)實(shí)體,實(shí)體間關(guān)系定義為“dis+‘_place_before’”,將三元組保存在數(shù)據(jù)庫中。
3.根據(jù)根據(jù)權(quán)利要求1所述的一種危險(xiǎn)化學(xué)品領(lǐng)域的知識(shí)表示方法,其特征在于:所述步驟4中危險(xiǎn)化學(xué)品的其他性質(zhì)知識(shí)由步驟1的危險(xiǎn)化學(xué)品相關(guān)知識(shí)中提取組合三元組而來,包括中文名、通用俗名、化學(xué)品英文名稱、英文名、技術(shù)說明書編碼、生產(chǎn)企業(yè)名稱、地址、生效日期、有害物成分、含量、危險(xiǎn)性類別、侵入途徑、健康危害、環(huán)境危害、燃爆危險(xiǎn)、皮膚接觸、眼睛接觸等。
4.根據(jù)權(quán)利要求1所述的一種危險(xiǎn)化學(xué)品領(lǐng)域的知識(shí)表示方法,其特征在于:所述步驟5中ChIncomTrans知識(shí)表示模型訓(xùn)練過程為:
步驟5.1:先從數(shù)據(jù)庫中獲取所有保存的三元組信息,除了此三元組信息,另外新建兩個(gè)文檔分別存儲(chǔ)實(shí)體和關(guān)系。
步驟5.2:將實(shí)體、關(guān)系分別初始化為向量,則每一個(gè)三元組可以用三個(gè)向量來表示,表示形式為(頭實(shí)體向量,關(guān)系向量,尾實(shí)體向量),用來表示上述向量。定義距離向量用表示距離向量的大小。
步驟5.3:計(jì)算出所有的三元組中每個(gè)頭實(shí)體所對應(yīng)出現(xiàn)的平均尾實(shí)體數(shù)和每個(gè)頭實(shí)體所對應(yīng)出現(xiàn)的平均尾實(shí)體數(shù)并根據(jù)得到的結(jié)果確定負(fù)樣例中替換頭實(shí)體和尾實(shí)體的概率為按照此概率對一定數(shù)量的正樣例三元組信息生成對應(yīng)的負(fù)樣例三元組,將全部新三元組添加到三元組列表中。
步驟5.4:定義損失函數(shù)并利用梯度下降法更新每個(gè)三元組中的頭實(shí)體向量實(shí)體間關(guān)系向量和尾實(shí)體向量
步驟5.5:重復(fù)上述步驟5.3和步驟5.4后一定次數(shù)或者梯度下降法誤差小于訓(xùn)練終止誤差后,最終得到了所有的實(shí)體和關(guān)系的向量表示結(jié)果,從而完成危險(xiǎn)化學(xué)品領(lǐng)域的知識(shí)表示過程。
5.根據(jù)權(quán)利要求1所述的一種危險(xiǎn)化學(xué)品領(lǐng)域的知識(shí)表示方法和權(quán)利要求3所述的ChIncomTrans知識(shí)表示模型訓(xùn)練過程,其特征在于:在所述的模型訓(xùn)練過程中,經(jīng)實(shí)驗(yàn)分析,在模型的超參數(shù)設(shè)置為:初始化的向量維度為50維;梯度下降法單次迭代大小為5000;訓(xùn)練終止誤差為0.001;訓(xùn)練最大次數(shù)為400次;“不相容”間隔γ1為5;非“不相容”間隔γ2為1;梯度下降法學(xué)習(xí)率0.01的情況下,模型取得了較好的知識(shí)表示效果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于重慶大學(xué),未經(jīng)重慶大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010440437.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 危險(xiǎn)判定裝置、危險(xiǎn)判定方法、危險(xiǎn)通知裝置和危險(xiǎn)判定程序
- 車輛危險(xiǎn)提醒裝置及車輛危險(xiǎn)提醒方法
- 危險(xiǎn)提示裝置、危險(xiǎn)提示系統(tǒng)、危險(xiǎn)提示方法以及程序
- 一種危險(xiǎn)防護(hù)方法、系統(tǒng)及相關(guān)設(shè)備
- 危險(xiǎn)檢測設(shè)備、用于危險(xiǎn)檢測的系統(tǒng)和危險(xiǎn)檢測器
- 危險(xiǎn)預(yù)測方法
- 避免危險(xiǎn)
- 避免危險(xiǎn)
- 危險(xiǎn)報(bào)警開關(guān)
- 危險(xiǎn)材料罐
- 化學(xué)品泄漏處理系統(tǒng)
- 化學(xué)品安全信息快速查詢和全周期追蹤數(shù)碼標(biāo)簽系統(tǒng)
- 基于地理位置的混存化學(xué)品的貨運(yùn)車廂管理方法和服務(wù)器
- 基于RFID的化學(xué)品倉庫管理方法和服務(wù)器
- 混存化學(xué)品的貨運(yùn)車廂管理方法和服務(wù)器
- 化學(xué)品倉庫管理方法、服務(wù)器與系統(tǒng)
- 化學(xué)品更換智能防呆系統(tǒng)及方法
- 化學(xué)品自動(dòng)供給裝置
- 化學(xué)品存取信息記錄方法及化學(xué)品存儲(chǔ)柜
- 核電站化學(xué)品信息管理方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)
- 基于本體的知識(shí)地圖繪制系統(tǒng)
- 基于知識(shí)地圖的領(lǐng)域知識(shí)瀏覽方法
- 一種基于知識(shí)本體的知識(shí)體系的建模方法
- 一種知識(shí)工程系統(tǒng)
- 知識(shí)自動(dòng)化系統(tǒng)和方法以及存儲(chǔ)器
- 基于SOLR的知識(shí)管理系統(tǒng)
- 基于知識(shí)節(jié)點(diǎn)所屬度的知識(shí)圖譜構(gòu)建方法和裝置
- 一種基于知識(shí)圖譜的稅務(wù)知識(shí)庫系統(tǒng)
- 一種智聯(lián)網(wǎng)中的網(wǎng)絡(luò)知識(shí)統(tǒng)一表征架構(gòu)及實(shí)現(xiàn)方法
- 知識(shí)點(diǎn)存儲(chǔ)方法、裝置、服務(wù)器及介質(zhì)





