[發明專利]一種基于多元異構數據挖掘的供應鏈在線知識圖譜構建方法在審
| 申請號: | 202210310617.8 | 申請日: | 2022-03-28 |
| 公開(公告)號: | CN114706996A | 公開(公告)日: | 2022-07-05 |
| 發明(設計)人: | 潘思哲;侯凱旋;牛占文;邵宏宇;王磊 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F40/279 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 程毓英 |
| 地址: | 300350 天津市津南區海*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 多元 數據 挖掘 供應 在線 知識 圖譜 構建 方法 | ||
1.一種基于多元異構數據挖掘的供應鏈在線知識圖譜構建方法,包括下列步驟:
步驟1,知識圖譜構建框架,構建企業設計資源本體庫,從多個層次建立設計需求和設計資源的規范化描述;
步驟2,知識圖譜的模式層構建,將承載在線評論的平臺分為電商網站、社交媒體以及專業網站,結合在線評論知識圖譜的需求分析,將在線評論的描述維度分為信源特征、內容特征及形式特征三個維度,方法如下:
步驟2.1,信源特征用來描述評論的外在信息;內容特征用來描述評論中涉及到的用戶對商品及服務的態度和滿意度,字數、觀點數、評論時間都屬于評論的形式特征;
步驟2.2,設置7個核心大類,具體包括評論、評論內容、特征觀點、用戶、評論對象、平臺以及商品;其中評論對象概念下又劃分了服務和商品兩個子概念,同時通過屬性定義更加豐富的描述類的數據特征;
步驟2.3,將定義好的類和關系進行知識建模,并進行模式層可視化,以評論類為中心,向外出發構建實體間的關系;
步驟3,數據層構建主要基于已經構建的模式層,抽取和融合多源在線評論數據中相應的內容,識別相應的實例、屬性和關系;
步驟3.1,將電商網站手機評論、相關術語百科、評測及新聞內容作為數據源,抓取手機評論數據與百科數據、評測新聞數據作為詞向量訓練的語料庫;
步驟3.2,通過構建專業語料庫,并基于word2vec進行詞向量訓練完成對產品特征詞的抽取和分類;
步驟3.3,基于word2Vec的詞向量模型通過神經網絡算法訓練語料庫,然后將詞語轉化為詞向量,并映射到高維空間,依據當前詞預測周圍詞語的概率;
步驟3.4,獲得詞語的向量表示,詞語之間的相似度通過余弦距離來衡量,將模式層中定義的概念作為種子詞,將相關詞按照相似度進行排序,并進行人工篩選和歸類;
步驟3.5,對評論文本進行特征-觀點對抽取;
步驟4,知識圖譜的存儲和繪制。
2.根據權利要求1所述的一種基于多元異構數據挖掘的供應鏈在線知識圖譜構建方法,其特征在于,步驟1具體包括:
步驟1.1,通過分析在線評論的存在方式以及具體數據,進行數據爬取;
步驟1.2,通過分析在線評論的信源特征、內容特征和形式特征來設計模式層的概念、關系及屬性;
步驟1.3,基于模式層的構建基礎,采用Word2vec詞向量訓練、觀點抽取、情感分析進行實體、關系、屬性的抽取;
步驟1.4,將處理后的結構化的在線評論數據進行整合處理,并存入圖數據庫中,通過圖數據庫查詢語言完成知識圖譜的可視化、語義檢索以及深度挖掘。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210310617.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種香櫞綠茶的制備方法
- 下一篇:極限頭低腳高截石位輔助床
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





