[發(fā)明專利]一種節(jié)點(diǎn)文本融合方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202110705528.9 | 申請(qǐng)日: | 2021-06-24 |
| 公開(公告)號(hào): | CN113420161A | 公開(公告)日: | 2021-09-21 |
| 發(fā)明(設(shè)計(jì))人: | 孫梓淇;白祚;莫洋 | 申請(qǐng)(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號(hào): | G06F16/36 | 分類號(hào): | G06F16/36;G06F40/30;G06K9/62 |
| 代理公司: | 深圳市世聯(lián)合知識(shí)產(chǎn)權(quán)代理有限公司 44385 | 代理人: | 汪琳琳 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 節(jié)點(diǎn) 文本 融合 方法 裝置 計(jì)算機(jī) 設(shè)備 存儲(chǔ) 介質(zhì) | ||
本申請(qǐng)實(shí)施例屬于大數(shù)據(jù)中的數(shù)據(jù)分析領(lǐng)域,涉及一種基于圖傳播算法的節(jié)點(diǎn)文本融合方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)。此外,本申請(qǐng)還涉及區(qū)塊鏈技術(shù),用戶的待處理節(jié)點(diǎn)文本以及所述節(jié)點(diǎn)數(shù)據(jù)集合可存儲(chǔ)于區(qū)塊鏈中。本申請(qǐng)通過采用訓(xùn)練好的語言模型對(duì)待處理的待處理節(jié)點(diǎn)文本進(jìn)行語義表示得到節(jié)點(diǎn)語義向量,使得后續(xù)計(jì)算文本相似度更精確,找到相近語義的概念節(jié)點(diǎn);通過圖傳播算法迭代收斂得到更可靠的相近概念數(shù)據(jù),有效增強(qiáng)融合后的概念數(shù)據(jù)的解析性。
技術(shù)領(lǐng)域
本申請(qǐng)涉及大數(shù)據(jù)中的數(shù)據(jù)分析領(lǐng)域,尤其涉及一種基于圖傳播算法的節(jié)點(diǎn)文本融合方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù)
知識(shí)圖譜(Knowledge Graph),在圖書情報(bào)界稱為知識(shí)域可視化或知識(shí)領(lǐng)域映射地圖,是顯示知識(shí)發(fā)展進(jìn)程與結(jié)構(gòu)關(guān)系的一系列各種不同的圖形,用可視化技術(shù)描述知識(shí)資源及其載體,挖掘、分析、構(gòu)建、繪制和顯示知識(shí)及它們之間的相互聯(lián)系。
現(xiàn)有一種概念融合方法,即基于文本相似度計(jì)算概念本體之間的相似度進(jìn)而實(shí)現(xiàn)相同或者相近節(jié)點(diǎn)的融合。
然而,申請(qǐng)人發(fā)現(xiàn)傳統(tǒng)的概念融合方法普遍不智能,由于不同詞組的含義不同,導(dǎo)致本身相似的詞組存在較大歧義,從而使得上述僅基于文本相似度計(jì)算的概念融合方法會(huì)不可避免地產(chǎn)生許多干擾性文本,在后續(xù)的機(jī)器學(xué)習(xí)中引入了不少雜質(zhì),影響了學(xué)習(xí)的效果,進(jìn)而影響了最后的實(shí)體關(guān)系預(yù)測以及知識(shí)圖譜構(gòu)建,由此可見,傳統(tǒng)的概念融合方法存在噪聲過多的問題。
發(fā)明內(nèi)容
本申請(qǐng)實(shí)施例的目的在于提出一種基于圖傳播算法的節(jié)點(diǎn)文本融合方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì),以解決傳統(tǒng)的概念融合方法存在噪聲過多的問題。
為了解決上述技術(shù)問題,本申請(qǐng)實(shí)施例提供一種基于圖傳播算法的節(jié)點(diǎn)文本融合方法,采用了如下所述的技術(shù)方案:
接收用戶終端發(fā)送的攜帶有待處理節(jié)點(diǎn)文本的節(jié)點(diǎn)融合請(qǐng)求;
根據(jù)訓(xùn)練好的語言模型對(duì)所述待處理節(jié)點(diǎn)文本進(jìn)行語義表示操作,得到節(jié)點(diǎn)語義向量;
根據(jù)所述節(jié)點(diǎn)語義向量計(jì)算所述每兩個(gè)待處理節(jié)點(diǎn)文本之間的文本相似度;
對(duì)所述文本相似度大于所述關(guān)聯(lián)閾值的所述待處理節(jié)點(diǎn)文本建立關(guān)聯(lián)關(guān)系,得到節(jié)點(diǎn)數(shù)據(jù)集合;
根據(jù)所述節(jié)點(diǎn)數(shù)據(jù)集合構(gòu)建與所述待處理節(jié)點(diǎn)文本相對(duì)應(yīng)的原始知識(shí)圖譜;
根據(jù)圖傳播算法對(duì)所述原始知識(shí)圖譜進(jìn)行篩選操作,得到同標(biāo)簽節(jié)點(diǎn)數(shù)據(jù);
根據(jù)預(yù)設(shè)的主節(jié)點(diǎn)確認(rèn)策略在所述同標(biāo)簽節(jié)點(diǎn)數(shù)據(jù)中確認(rèn)主節(jié)點(diǎn)概念以及融合節(jié)點(diǎn)概念,得到語義融合后的節(jié)點(diǎn)數(shù)據(jù)集合。
為了解決上述技術(shù)問題,本申請(qǐng)實(shí)施例還提供一種基于圖傳播算法的節(jié)點(diǎn)文本融合裝置,采用了如下所述的技術(shù)方案:
請(qǐng)求接收模塊,用于接收用戶終端發(fā)送的攜帶有待處理節(jié)點(diǎn)文本的節(jié)點(diǎn)融合請(qǐng)求;
語義表示模塊,用于根據(jù)訓(xùn)練好的語言模型對(duì)所述待處理節(jié)點(diǎn)文本進(jìn)行語義表示操作,得到節(jié)點(diǎn)語義向量;
相似度計(jì)算模塊,用于根據(jù)所述節(jié)點(diǎn)語義向量計(jì)算所述每兩個(gè)待處理節(jié)點(diǎn)文本之間的文本相似度;
關(guān)聯(lián)關(guān)系建立模塊,用于對(duì)所述文本相似度大于所述關(guān)聯(lián)閾值的所述待處理節(jié)點(diǎn)文本建立關(guān)聯(lián)關(guān)系,得到節(jié)點(diǎn)數(shù)據(jù)集合;
圖譜構(gòu)建模塊,用于根據(jù)所述節(jié)點(diǎn)數(shù)據(jù)集合構(gòu)建與所述待處理節(jié)點(diǎn)文本相對(duì)應(yīng)的原始知識(shí)圖譜;
篩選操作模塊,用于根據(jù)圖傳播算法對(duì)所述原始知識(shí)圖譜進(jìn)行篩選操作,得到同標(biāo)簽節(jié)點(diǎn)數(shù)據(jù);
節(jié)點(diǎn)確認(rèn)模塊,用于根據(jù)預(yù)設(shè)的主節(jié)點(diǎn)確認(rèn)策略在所述同標(biāo)簽節(jié)點(diǎn)數(shù)據(jù)中確認(rèn)主節(jié)點(diǎn)概念以及融合節(jié)點(diǎn)概念,得到語義融合后的節(jié)點(diǎn)數(shù)據(jù)集合。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110705528.9/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 節(jié)點(diǎn)查詢方法、節(jié)點(diǎn)、移動(dòng)通訊系統(tǒng)和計(jì)算機(jī)程序產(chǎn)品
- 一種根據(jù)節(jié)點(diǎn)集合構(gòu)造節(jié)點(diǎn)關(guān)系樹的方法、裝置及系統(tǒng)
- 一種DHT網(wǎng)絡(luò)負(fù)載均衡裝置及虛節(jié)點(diǎn)劃分的方法
- 一種無線傳感網(wǎng)地理位置路由空洞處理方法
- 節(jié)點(diǎn)鎖定部件、節(jié)點(diǎn)滑軌、節(jié)點(diǎn)和機(jī)箱
- 一種待推薦節(jié)點(diǎn)線路的確定方法及裝置
- 流控方法、目標(biāo)節(jié)點(diǎn)、節(jié)點(diǎn)及施主節(jié)點(diǎn)
- 節(jié)點(diǎn)布局確定方法以及裝置
- 一種具有分布式柔度的全柔順微位移放大機(jī)構(gòu)
- 節(jié)點(diǎn)掛載方法、裝置、網(wǎng)絡(luò)節(jié)點(diǎn)及存儲(chǔ)介質(zhì)
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





