[發明專利]一種基于機器學習和邊緣計算的職業屬性識別方法及系統有效
| 申請號: | 202010096332.X | 申請日: | 2020-02-17 |
| 公開(公告)號: | CN111221973B | 公開(公告)日: | 2021-07-20 |
| 發明(設計)人: | 吳曉軍 | 申請(專利權)人: | 河北冀聯人力資源服務集團有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/951;G06F40/205;G06F40/126 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 050073 河北*** | 國省代碼: | 河北;13 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 機器 學習 邊緣 計算 職業 屬性 識別 方法 系統 | ||
1.一種基于機器學習和邊緣計算的職業屬性識別方法,其特征在于:
步驟101,制定網頁搜索范圍策略、網頁搜索方法策略,根據所述網頁搜索范圍策略、網頁搜索方法策略執行爬蟲算法識別職業種類,對比數據庫,識別第一職業屬性;執行爬蟲監聽調度模塊算法更新、數據庫更新命令,傳遞所述第一職業屬性并提交分析請求;
步驟102,接收所述分析請求,分析所述第一職業屬性,將段落文字通過語義、語法、語境分析,提取所述第一職業屬性關鍵詞,將所述關鍵詞轉換為十六進制的ASCII編碼值,將ASCII編碼值采用算法拼接,作為所述第一職業屬性的標記特征值;
步驟103,接收所述第一職業屬性的標記特征值,遍歷比對所述第一職業屬性的標記特征值與數據庫模塊的職業屬性特征值,識別所述第一職業屬性是否為現有職業屬性,若否則歸入初步識別結果;
具體計算方式為:W為新職業屬性標記特征值,M為已存在職業屬性特征值,步碼長度為x,len(W)為W的長度,len(M)為M的長度,W的步數i=len(W)/x,M的步數j=len(M)/x,u、v為自然數,mot(Wu,Mv)為W的第u個片段與M的第v個片段距離值,Dmin為所有片段中距離最近值,Dmax為所有片段距離最大值,則Si為相似置信度,公式為:
Si大于等于51%則說明新職業屬性為原有職業屬性,將新職業屬性ASCII編碼值更新至數據庫中,并通知爬蟲監聽調度模塊廣播新職業屬性數據庫;Si小于51%則說明該職業屬性為新職業屬性,保存新職業屬性ASCII編碼值,并通知智能學習模塊學習訓練;
步驟104,采用最低風險回歸隨機預測方法,對所述初步識別結果進行機器學習,獲得所述第一職業屬性分類。
2.根據權利要求1所述的方法,其特征在于:基于機器學習和云計算、邊緣計算的職業屬性識別方法還包括監聽邊緣爬蟲網絡計算體模塊執行狀態,對異常、死機邊緣爬蟲網絡計算體模塊進行重啟。
3.根據權利要求1所述的方法,其特征在于:所述步驟103識別所述第一職業屬性是否為現有職業屬性具體為:比對置信度和預設閾值,若所述置信度大于或等于預設閾值則第一職業屬性為現有職業屬性,否則為新職業屬性。
4.根據權利要求1所述的方法,其特征在于:獲得所示第一職業屬性分類后,發送至客戶端模塊展示給用戶。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河北冀聯人力資源服務集團有限公司,未經河北冀聯人力資源服務集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010096332.X/1.html,轉載請聲明來源鉆瓜專利網。





