[發明專利]一種基于組合語義相似度的國防建設動態信息推薦方法有效
| 申請號: | 202011188956.0 | 申請日: | 2020-10-30 |
| 公開(公告)號: | CN112287229B | 公開(公告)日: | 2022-10-21 |
| 發明(設計)人: | 李曉松;李增華;程佳軍;彭欣然;蔣玉嬌;肖振華 | 申請(專利權)人: | 中國人民解放軍軍事科學院軍事科學信息研究中心 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/33;G06F16/951;G06F40/30 |
| 代理公司: | 中國和平利用軍工技術協會專利中心 11215 | 代理人: | 劉光德;彭霜 |
| 地址: | 100142 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 組合 語義 相似 國防建設 動態 信息 推薦 方法 | ||
本發明提出了一種基于組合語義相似度的國防建設動態信息推薦方法,所述方法包括:根據對用戶行為的分析建立用戶關注語料庫以及選擇與其興趣匹配的網站作為抓取對象,根據設置的多層次抓取要素分別抓取不同網站的相關信息,基于文本同現相似度和文本語義相似度值的組合語義計算國防建設動態信息相似度,向用戶推薦相似度高的國防建設動態信息。本發明的技術方案能夠按照指定的多層次要素自動抓取國防建設動態信息,提高了信息抓取的效率,并且,通過組合語義計算國防建設動態信息相似度,推薦信息的質量得到了提升。
技術領域
本發明屬于計算機信息處理領域,特別涉及一種基于組合語義相似度的國防建設動態信息推薦方法。
背景技術
隨著互聯網的普及和全球信息化進程的發展,網絡已經成為人們獲取信息的主要途徑,互聯網上的信息資源也開始呈現爆炸式增長。用戶往往很難找到真正有用的信息,同時一些很少被用戶關注到的信息很容易成為孤島信息。個性化信息服務系統的出現可以有效地解決這些問題,它分析用戶的興趣和瀏覽記錄,向用戶推薦其感興趣的信息,幫助用戶尋找真正需要的信息。但是,當下的個性化信息服務系統并不成熟,存在推薦效率低,推薦質量差等問題。
發明內容
針對現有技術中存在的上述缺陷,本發明提出了一種基于組合語義相似度的國防建設動態信息推薦方法,根據對用戶的行為分析構建用戶關注語料庫,按照多層次要素自動抓取相關網站信息,通過組合語義相似度對比,得到相似度較高的信息,并推薦給用戶。與現有技術相比,該方法具有以下優點:
1)能夠按照指定的多層次要素自動抓取國防建設動態信息,提升了信息抓取效率;
2)通過組合語義相似度的方法,提高了推薦信息的質量,自動推薦用戶關心的相關國防建設動態信息,提高了用戶體驗。
本發明提出的基于組合語義相似度的國防建設動態信息推薦方法,包括以下步驟:
S1.建立用戶關注語料庫
獲取用戶行為,包括用戶的歷史瀏覽記錄、訪問的廣告信息、搜索的關鍵詞、分享的信息;收集用戶在輸入過程中產生的原始文本,根據所述原始文本中的自然標記將其劃分為多個自然標記文本,將所述自然標記文本輸入分詞模型進行分詞訓練,得到用戶關注語料庫;
S2.抓取國防建設動態信息
S21.分析所述用戶行為,選擇與其興趣匹配的網站作為抓取對象,用html(k)表示第k個抓取對象;
S22.針對第k個抓取對象,利用Web scraper插件建立抓取項目project(k),包括抓取項目名稱和網址;
S23.針對所述抓取對象,結合國防建設動態信息的特點,建立多層次的抓取要素;
S24.根據設置的多層次抓取要素,分別抓取不同網站的相關信息,將抓取到的信息保存在抓取結果文件中,所述抓取結果文件中的每個條目包括標題、發布單位、發布時間和信息內容;
S3.計算國防建設動態信息相似度
S31.自動提取所述抓取結果文件中的條目標題;
S32.基于文本同現計算國防建設動態信息相似度,并基于文本語義相似度值計算國防建設動態信息相似度;
S33.基于文本同現相似度和文本語義相似度值組合語義相似度計算國防建設動態信息相似度;
S4.設置推薦信息的閾值,根據閾值推薦國防建設動態信息。
附圖說明
圖1顯示了本發明的基于組合語義相似度的國防建設動態信息推薦方法的流程;
圖2顯示了多層次要素;
圖3顯示了根據抓取的國防建設動態信息自動提取的信息標題。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍軍事科學院軍事科學信息研究中心,未經中國人民解放軍軍事科學院軍事科學信息研究中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011188956.0/2.html,轉載請聲明來源鉆瓜專利網。





