[發明專利]面向大數據文本挖掘的動態認知語義匹配方法有效
| 申請號: | 202010263232.1 | 申請日: | 2020-04-05 |
| 公開(公告)號: | CN111552816B | 公開(公告)日: | 2022-07-19 |
| 發明(設計)人: | 趙安平;于宇 | 申請(專利權)人: | 溫州大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 溫州金甌專利事務所(普通合伙) 33237 | 代理人: | 林益建 |
| 地址: | 325000 浙江省溫州市甌海*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 數據 文本 挖掘 動態 認知 語義 匹配 方法 | ||
本發明公開了一種面向大數據文本挖掘的動態認知語義匹配方法,通過對大數據文本空間進行文本特征和語義空間的量子認知表示,得到表征大數據文本空間語義空間的線性組合,針對所述線性組合采用基于量子概率的關聯語義空間發現方法獲取所述大數據文本空間的語義表示和語義建模,根據語義表示和語義建模進行建模,得到初始匹配模型,采用深度神經網絡針對所述初始匹配模型計算詞間的語義關系,獲得動態認知語義空間預測模型,采用動態認知語義空間預測模型對待匹配語句進行語義匹配,以實現對待匹配語句的語義匹配。
技術領域
本發明涉及面向大數據文本挖掘技術領域,尤其涉及一種面向大數據文本挖掘的動態認知語義匹配方法。
背景技術
大數據時代,從海量的非結構化文本數據中挖掘其潛在的價值,成為大數據處理技術研究的主要動力。綜合分析國內外研究和技術現狀,在面向大數據文本挖掘的過程中,以人的認知規律為驅動、語義智能化的動態認知語義空間匹配方面還存在三個主要問題:
1)研究的對象是大數據文本,不能采用傳統的認知語義空間方法思路,更多的應該考慮在特定情境下的認知的局部的形式化,需要建立在動態語義進化情境下,建模能夠可靠合理解釋和評價的語義空間匹配來模擬人的各種認知心理現象。
2)面向大數據文本挖掘過程中出現全新涌現語義等現象,不能采用傳統的經典概率理論框架來解釋,因此,建模不同的觀測視角的自然語言意義理解和語義匹配,傳統方法存在一定局限性,許多現成的文本挖掘理論的結果和工具不能直接利用。
3)針對大數據文本挖掘技術中具有關鍵支撐作用的、符合人類認知規律的動態認知語義匹配的各個因素還需繼續提煉,松散性的語義關聯不能充分應用于海量的文本數據中發現新的模式、模型、規則、趨勢等知識。
因此,研究如何以符合人類認知規律的方式進行認知語義匹配來支持智能的大數據文本挖掘過程,并且描述和解釋在此過程中經典概率理論無法解釋的人類自然語言理解和認知過程,是目前亟待解決的課題。
發明內容
針對以上問題,本發明提出一種面向大數據文本挖掘的動態認知語義匹配方法。
為實現本發明的目的,提供一種面向大數據文本挖掘的動態認知語義匹配方法,包括如下步驟:
S10,對大數據文本空間進行文本特征和語義空間的量子認知表示,得到表征大數據文本空間語義空間的線性組合;
S20,針對所述線性組合采用基于量子概率的關聯語義空間發現方法獲取所述大數據文本空間的語義表示和語義建模,根據語義表示和語義建模進行建模,得到初始匹配模型;
S30,采用深度神經網絡針對所述初始匹配模型計算詞間的語義關系,獲得動態認知語義空間預測模型,采用動態認知語義空間預測模型對待匹配語句進行語義匹配。
在一個實施例中,所述對大數據文本空間進行文本特征和語義空間的量子認知表示,得到表征大數據文本空間語義空間的線性組合包括:
基于量子認知理論中對情境的隱含考慮,獲取大數據文本空間的基本狀態所構成的量子態向量;
根據所述量子態向量采用超空間模擬語言模型在量子認知和語義空間之間建立關聯,將大數據文本空間的文本特征和語義空間嵌入到量子理論中,以將量子描述方法引入代表人類認知行為現象的認知語義空間,得到表征大數據文本空間語義空間的線性組合。
作為一個實施例,所述量子態向量包括:
B={|S1,K,|Sn},
其中|Si表示第i個基本狀態,B表示量子態向量,i的取值為1、Λ、n。
在一個實施例中,所述針對所述線性組合采用基于量子概率的關聯語義空間發現方法獲取所述大數據文本空間的語義表示和語義建模包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于溫州大學,未經溫州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010263232.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種電力工程用電力接地樁
- 下一篇:用于癌癥免疫治療的肽及其肽組合物
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





