[發(fā)明專(zhuān)利]問(wèn)題挖掘方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202110581186.4 | 申請(qǐng)日: | 2021-05-27 |
| 公開(kāi)(公告)號(hào): | CN113157853A | 公開(kāi)(公告)日: | 2021-07-23 |
| 發(fā)明(設(shè)計(jì))人: | 羅霄;孫澤燁;陳思姣;李炫 | 申請(qǐng)(專(zhuān)利權(quán))人: | 中國(guó)平安人壽保險(xiǎn)股份有限公司 |
| 主分類(lèi)號(hào): | G06F16/31 | 分類(lèi)號(hào): | G06F16/31;G06F16/335;G06F16/35;G06F40/126;G06F40/279 |
| 代理公司: | 深圳市沃德知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
| 地址: | 518000 廣東省深圳市福田區(qū)益田路5033號(hào)*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 問(wèn)題 挖掘 方法 裝置 電子設(shè)備 存儲(chǔ) 介質(zhì) | ||
1.一種問(wèn)題挖掘方法,其特征在于,所述方法包括:
將原始文本中的數(shù)據(jù)進(jìn)行預(yù)處理,得到初始詞語(yǔ)集,并計(jì)算所述初始詞語(yǔ)集中每個(gè)詞語(yǔ)在所述原始文本中的權(quán)重;
利用詞向量轉(zhuǎn)化模型將所述初始詞語(yǔ)集中每個(gè)詞語(yǔ)轉(zhuǎn)化為詞向量,根據(jù)所述詞向量與所述權(quán)重,生成加權(quán)詞向量;
根據(jù)所述加權(quán)詞向量,從所述原始文本中篩選出滿足預(yù)設(shè)條件的句向量,得到目標(biāo)句向量;
識(shí)別所述目標(biāo)句向量之間的關(guān)聯(lián)關(guān)系,并根據(jù)所述關(guān)聯(lián)關(guān)系,構(gòu)建所述目標(biāo)句向量的關(guān)系網(wǎng)絡(luò)結(jié)構(gòu);
計(jì)算所述關(guān)系網(wǎng)絡(luò)結(jié)構(gòu)中每個(gè)目標(biāo)句向量的平均距離值,根據(jù)所述平均距離值,生成所述原始文本的問(wèn)題挖掘結(jié)果。
2.如權(quán)利要求1所述的問(wèn)題挖掘方法,其特征在于,所述計(jì)算所述初始詞語(yǔ)集中每個(gè)詞語(yǔ)在所述原始文本中的權(quán)重,包括:
通過(guò)遍歷操作依次選擇所述初始詞語(yǔ)集中任意兩個(gè)詞語(yǔ),計(jì)算所述兩個(gè)詞語(yǔ)在所述原始文本中的依存關(guān)聯(lián)度;
根據(jù)所述依存關(guān)聯(lián)度,計(jì)算所述兩個(gè)詞語(yǔ)的引力;
根據(jù)所述依存關(guān)聯(lián)度和所述引力,計(jì)算所述兩個(gè)詞語(yǔ)的關(guān)聯(lián)強(qiáng)度;
根據(jù)所述關(guān)聯(lián)強(qiáng)度,計(jì)算所述兩個(gè)詞語(yǔ)中任意一個(gè)詞語(yǔ)的權(quán)重。
3.如權(quán)利要求1所述的問(wèn)題挖掘方法,其特征在于,所述利用詞向量轉(zhuǎn)化模型將所述初始詞語(yǔ)集中每個(gè)詞語(yǔ)轉(zhuǎn)化為詞向量,包括:
利用所述詞向量轉(zhuǎn)化模型中的編碼層對(duì)所述初始詞語(yǔ)集中每個(gè)詞語(yǔ)進(jìn)行向量編碼,生成初始詞向量;
利用所述詞向量轉(zhuǎn)化模型中的前饋?zhàn)⒁饬C(jī)制對(duì)所述初始詞向量進(jìn)行序列提取,得到詞向量。
4.如權(quán)利要求3所述的問(wèn)題挖掘方法,其特征在于,所述利用所述詞向量轉(zhuǎn)化模型中的編碼層對(duì)所述初始詞語(yǔ)集中的每個(gè)詞語(yǔ)進(jìn)行向量編碼,生成初始詞向量,包括:
利用所述編碼層對(duì)所述初始詞語(yǔ)集中每個(gè)詞語(yǔ)進(jìn)行索引編碼,得到詞編碼索引;
對(duì)所述詞編碼索引構(gòu)建向量矩陣,生成初始詞向量。
5.如權(quán)利要求3所述的問(wèn)題挖掘方法,其特征在于,所述利用所述詞向量轉(zhuǎn)化模型中的前饋?zhàn)⒁饬C(jī)制對(duì)所述初始詞向量進(jìn)行序列提取,得到詞向量,包括:
利用所述前饋?zhàn)⒁饬C(jī)制中的自注意力模塊查詢所述初始詞向量;
利用所述前饋?zhàn)⒁饬C(jī)制中的卷積模塊對(duì)所述初始詞向量進(jìn)行特征提取,得到特征詞向量;
利用所述前饋?zhàn)⒁饬C(jī)制中的編碼器提取所述特征詞向量的信息序列;
利用所述前饋?zhàn)⒁饬C(jī)制中的解碼器將所述信息序列進(jìn)行解碼,得到詞向量。
6.如權(quán)利要求1所述的問(wèn)題挖掘方法,其特征在于,所述根據(jù)所述加權(quán)詞向量,從所述原始文本中篩選出滿足預(yù)設(shè)條件的句向量,得到目標(biāo)句向量,包括:
將所述加權(quán)詞向量進(jìn)行匯總,生成初始句向量,計(jì)算所述初始句向量的平均權(quán)重;
根據(jù)所述平均權(quán)重,從所述初始句向量中篩選出滿足所述預(yù)設(shè)條件的句向量,得到目標(biāo)句向量。
7.如權(quán)利要求1至6中任意一項(xiàng)所述的問(wèn)題挖掘方法,其特征在于,所述識(shí)別所述目標(biāo)句向量之間的關(guān)聯(lián)關(guān)系,包括:
提取所述目標(biāo)句向量中的特征詞向量;
識(shí)別所述特征詞向量之間的節(jié)點(diǎn)關(guān)系,得到對(duì)應(yīng)目標(biāo)句向量之間的關(guān)聯(lián)關(guān)系。
8.一種問(wèn)題挖掘裝置,其特征在于,所述裝置包括:
計(jì)算模塊,用于將原始文本中的數(shù)據(jù)進(jìn)行預(yù)處理,得到初始詞語(yǔ)集,并計(jì)算所述初始詞語(yǔ)集中每個(gè)詞語(yǔ)在所述原始文本中的權(quán)重;
轉(zhuǎn)化模塊,用于利用詞向量轉(zhuǎn)化模型將所述初始詞語(yǔ)集中每個(gè)詞語(yǔ)轉(zhuǎn)化為詞向量,根據(jù)所述詞向量與所述權(quán)重,生成加權(quán)詞向量;
篩選模塊,用于根據(jù)所述加權(quán)詞向量,從所述原始文本中篩選出滿足預(yù)設(shè)條件的句向量,得到目標(biāo)句向量;
構(gòu)建模塊,用于識(shí)別所述目標(biāo)句向量之間的關(guān)聯(lián)關(guān)系,并根據(jù)所述關(guān)聯(lián)關(guān)系,構(gòu)建所述目標(biāo)句向量的關(guān)系網(wǎng)絡(luò)結(jié)構(gòu);
生成模塊,用于計(jì)算所述關(guān)系網(wǎng)絡(luò)結(jié)構(gòu)中每個(gè)目標(biāo)句向量的平均距離值,根據(jù)所述平均距離值,生成所述原始文本的問(wèn)題挖掘結(jié)果。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于中國(guó)平安人壽保險(xiǎn)股份有限公司,未經(jīng)中國(guó)平安人壽保險(xiǎn)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110581186.4/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





