[發(fā)明專利]一種基于深度學(xué)習(xí)的信息技術(shù)數(shù)據(jù)實(shí)體屬性抽取方法在審
| 申請?zhí)枺?/td> | 202010316616.5 | 申請日: | 2020-04-21 |
| 公開(公告)號: | CN111914055A | 公開(公告)日: | 2020-11-10 |
| 發(fā)明(設(shè)計)人: | 郭紹翠;楊旭;宋正強(qiáng);孫維夫 | 申請(專利權(quán))人: | 煙臺職業(yè)學(xué)院 |
| 主分類號: | G06F16/31 | 分類號: | G06F16/31;G06F16/35;G06F40/295;G06F16/332 |
| 代理公司: | 深圳紫晴專利代理事務(wù)所(普通合伙) 44646 | 代理人: | 付欽偉 |
| 地址: | 264670 山東省煙臺*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 深度 學(xué)習(xí) 信息技術(shù) 數(shù)據(jù) 實(shí)體 屬性 抽取 方法 | ||
1.一種基于深度學(xué)習(xí)的信息技術(shù)數(shù)據(jù)實(shí)體屬性抽取方法,其特征在于,包括以下具體步驟:
一、插入——將字或者詞變成一個稠密的向量,一般認(rèn)為待變成稠密向量的詞與實(shí)體之間的位置是一個相對位置;
二、編碼——對于關(guān)系識別來說,即包含卷積神經(jīng)網(wǎng)絡(luò)相關(guān)的,也包含運(yùn)行相關(guān)的,把上下文的信息考慮進(jìn)來。舉例說明,一個脈沖耦合神經(jīng)網(wǎng)絡(luò)可通過兩個實(shí)體把句子分為多個部分,每個部分分別做卷積神經(jīng)網(wǎng)絡(luò)的最大值池化,再經(jīng)過Softmax分類器進(jìn)行分類;
三、處理——處理器可以處理分辨出兩個實(shí)體是由于哪個詞分辨出是顧傭的關(guān)系;
四、判定——對定長的向量進(jìn)行判定分類,主要是把兩部分的一些模型的參數(shù)在底層被共享起來。
2.根據(jù)權(quán)利要求1所述的一種基于深度學(xué)習(xí)的信息技術(shù)數(shù)據(jù)實(shí)體屬性抽取方法,其特征在于,將文本信息里的字或者詞變成一個稠密的向量,便于取機(jī)器的識別。
3.根據(jù)權(quán)利要求1所述的一種基于深度學(xué)習(xí)的信息技術(shù)數(shù)據(jù)實(shí)體屬性抽取方法,其特征在于,創(chuàng)建一個為待變成稠密向量的詞與實(shí)體之間的位置。
4.根據(jù)權(quán)利要求1所述的一種基于深度學(xué)習(xí)的信息技術(shù)數(shù)據(jù)實(shí)體屬性抽取方法,其特征在于,在獲取對應(yīng)位置的稠密向量后,使脈沖耦合神經(jīng)網(wǎng)絡(luò)通過兩個實(shí)體把句子分為多個部分,每個部分分別做卷積神經(jīng)網(wǎng)絡(luò)的最大值池化。
5.根據(jù)權(quán)利要求1所述的一種基于深度學(xué)習(xí)的信息技術(shù)數(shù)據(jù)實(shí)體屬性抽取方法,其特征在于,再將最大值池化的每個部分經(jīng)過Softmax分類器進(jìn)行分類,避免因直接對多個部分進(jìn)行最大值池化造成數(shù)據(jù)信息的丟失,提高機(jī)器抽取的準(zhǔn)確度。
6.根據(jù)權(quán)利要求1所述的一種基于深度學(xué)習(xí)的信息技術(shù)數(shù)據(jù)實(shí)體屬性抽取方法,其特征在于,對編碼后的兩個實(shí)體進(jìn)行處理,便于確定兩個實(shí)體之間的從屬關(guān)系。
7.根據(jù)權(quán)利要求1所述的一種基于深度學(xué)習(xí)的信息技術(shù)數(shù)據(jù)實(shí)體屬性抽取方法,其特征在于,使機(jī)器進(jìn)行層級關(guān)系的區(qū)分時,便于根據(jù)從屬關(guān)系進(jìn)行層級關(guān)系的辨別。
8.根據(jù)權(quán)利要求1所述的一種基于深度學(xué)習(xí)的信息技術(shù)數(shù)據(jù)實(shí)體屬性抽取方法,其特征在于,便于在對不同長度的向量進(jìn)行層級關(guān)系的分辨后,對定長的向量進(jìn)行建模。
9.根據(jù)權(quán)利要求1所述的一種基于深度學(xué)習(xí)的信息技術(shù)數(shù)據(jù)實(shí)體屬性抽取方法,其特征在于,便于使底層的模型參數(shù)可在外界設(shè)備命令需求時得到共享,便于提高機(jī)器數(shù)據(jù)抽取的速率。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于煙臺職業(yè)學(xué)院,未經(jīng)煙臺職業(yè)學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010316616.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





