[發明專利]基于搜索引擎檢索數據的企業產品名錄挖掘方法有效
| 申請號: | 202011525024.0 | 申請日: | 2020-12-22 |
| 公開(公告)號: | CN112559600B | 公開(公告)日: | 2021-07-27 |
| 發明(設計)人: | 王曙;徐惠;張為標;鄭堅 | 申請(專利權)人: | 南京萬購信息科技有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06F16/953 |
| 代理公司: | 南京聚匠知識產權代理有限公司 32339 | 代理人: | 盧美玲 |
| 地址: | 210019 江蘇省南京市建鄴*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 搜索引擎 檢索 數據 企業 產品 名錄 挖掘 方法 | ||
本發明提供了基于搜索引擎檢索數據的企業產品名錄挖掘方法,包括S1、建立待挖掘企業名目錄庫{Cn},S2、建立待分析產業的產品名目錄庫{Pm},S3、構建聯合檢索條件集合{Qnm},S4、獲取檢索頁面結果,S5、獲取檢索結果反饋數目,S6、確定結果篩選閾值θ,S7、通過閾值判斷企業名稱和企業產品的相關性,S8、確定產品名錄集合等步驟。該發明可以應用于企業具體生產產品名錄的確定,能夠精確地調查企業具體的產品或服務名稱,對企業信息的深度挖掘分析和利用具有支撐性的作用,具有十分廣闊的應用前景。
技術領域
本發明屬于計算機數據挖掘領域,具體涉及一種基于搜索引擎檢索數據的企業產品名錄挖掘方法。
背景技術
企業的生產產品名錄是企業核心數據,具體指企業生產產出的產品,包括有物品、服務、信息等內容。明確企業生產產品名錄,可以有效解析該企業所出產業鏈的位置,對挖掘企業的經濟影響和社會影響具有深遠意義。而調研區域內企業生產產品名錄,對區域發展與規劃、企業行為與決策、政府招商與決策等方面具有深遠意義。因此,大范圍調研企業生產產品名錄對數據挖掘與預測具有深遠的意義。
目前,大范圍調研獲取企業生產產品名錄并不存在行之有效的方法。最為接近獲取此類數據的方法是,利用企業工商登記的企業營業范圍,明確企業的相關經營活動領域,例如A企業的經營范圍:汽車、汽車摩托車零配件、機械設備。這種方法表達生產產品名錄存在以下兩方面核心問題:第一,不能明確具體的產品名稱,比如汽車摩托車零配件包含幾千種,所以無從得知企業的實際生產產品;第二,經營范圍遠廣于企業生產產品。許多公司為了后期發展需求,會在工商登記注冊時,增加諸多未涉及的領域。因此,利用企業工商登記的企業營業范圍這種方法難以獲得企業的生產產品名錄。
鑒于此,本發明基于大數據思維,利用互聯網信息中事物間存在關聯的特性,提出了一種基于搜索引擎檢索數據的企業生產產品名錄挖掘方法。該方法能夠有效實現大范圍調研獲取企業生產產品名錄數據,具有廣泛的應用前景。
發明內容
針對上述提到的問題,本發明提供的基于搜索引擎檢索數據的企業產品名錄挖掘方法,根據互聯網信息中事物間存在關聯的特性,從互聯網信息中挖掘得出企業的生產產品名錄。本發明采用的技術方案如下:
基于搜索引擎檢索數據的企業產品名錄挖掘方法,包括如下步驟:
S1、建立待挖掘企業名目錄庫{Cn},包含n個企業,其中第i個公司名稱為Ci;
S2、建立待分析產業的產品名目錄庫{Pm},包含m個產品,其中第j項產品名稱為Pj;
S3、構建聯合檢索條件集合{Qnm};
S4、獲取檢索頁面結果;
S5、獲取檢索結果反饋數目;
S6、確定結果篩選閾值θ;
S7、通過閾值判斷企業名稱和企業產品的相關性;
S8、確定產品名錄集合。
進一步地,所述步驟S3具體包括如下步驟:
S31、循環遍歷n個企業和m個產品名錄;
S32、在每個遍歷中生成聯合檢索條件qij,qij表示第i個公司和第j個產品的檢索條件,其字符表達形式為qij=CisPj,其中s表示空格;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京萬購信息科技有限公司,未經南京萬購信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011525024.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種擺臂式涂布勻膠輥恒壓裝置及其工作方法
- 下一篇:一種生活垃圾收集裝置
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





