[發(fā)明專(zhuān)利]一種用工平臺(tái)評(píng)論挖掘的方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 202110369952.0 | 申請(qǐng)日: | 2021-04-07 |
| 公開(kāi)(公告)號(hào): | CN113111187B | 公開(kāi)(公告)日: | 2023-03-10 |
| 發(fā)明(設(shè)計(jì))人: | 吳方同;吳曉軍 | 申請(qǐng)(專(zhuān)利權(quán))人: | 河北冀聯(lián)人力資源服務(wù)集團(tuán)有限公司 |
| 主分類(lèi)號(hào): | G06F16/36 | 分類(lèi)號(hào): | G06F16/36;G06F40/216;G06F40/242;G06F40/289 |
| 代理公司: | 蘇州瞪羚知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 32438 | 代理人: | 周治宇 |
| 地址: | 050073 河北*** | 國(guó)省代碼: | 河北;13 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用工 平臺(tái) 評(píng)論 挖掘 方法 系統(tǒng) | ||
1.一種用工平臺(tái)評(píng)論挖掘的方法,其特征在于,
步驟101,獲取用工平臺(tái)工人評(píng)論數(shù)據(jù),將所述評(píng)論數(shù)據(jù)存儲(chǔ)在評(píng)論數(shù)據(jù)表,并將所述評(píng)論數(shù)據(jù)標(biāo)識(shí)為新數(shù)據(jù);
步驟102,構(gòu)建用工單位詞庫(kù);
所述構(gòu)建用工單位詞庫(kù)具體包括:
(1)將新評(píng)論裝載在文本集合XTexti(j),其中i表示新評(píng)論個(gè)數(shù),j為第j條評(píng)論;
(2)使用indexOf()函數(shù)判斷新評(píng)論數(shù)據(jù)是否含有用工單位信息,當(dāng)XTexti(j).indexOf(公司)==-1,或者XTexti(j).indexOf(單位)==-1,XTexti(j).indexOf(工廠(chǎng))==-1,XTexti(j).indexOf(廠(chǎng)子)==-1,認(rèn)為該評(píng)論數(shù)據(jù)含有用工單位信息;
(3)對(duì)于含有用工單位信息的數(shù)據(jù)XTexti(j),引入jieba分詞函數(shù),將評(píng)論數(shù)據(jù)進(jìn)行分詞,定義分詞鏈Dwordn(w),其中:n=1表示名詞、n=2表示動(dòng)詞、n=3表示形容詞、n=4表示數(shù)量詞、n=5表示代詞、n=6表示副詞、n=7表示介詞、n=8表示連詞、n=9表示助詞、n=10表示嘆詞、n=11表示擬聲詞,W表示詞語(yǔ)的順序,Dwordn(w)的值表示具體詞匯;
(4)對(duì)分詞文本Dwordn(w)進(jìn)行處理,若n=1,分詞為名詞,引用標(biāo)準(zhǔn)名詞字典Mdic,判斷該分詞是否在常用名詞字典中,如果不在常用名詞字典里函數(shù)反饋0,如果在常用名詞字典里,跳到下一個(gè)詞匯;
(5)對(duì)函數(shù)返回值為0的情況,查看用工單位庫(kù)Bdic是否已存在該名詞,若存在則跳過(guò)繼續(xù)執(zhí)行;
(6)用工單位詞庫(kù)不存在該名詞,若名詞位置序號(hào)小于用工單位出現(xiàn)位置序號(hào)p,使用AddDIC(Dwordn(w))函數(shù),將該詞匯加入用工單位詞庫(kù);
步驟103,獲取工人用工評(píng)論的崗位工種,構(gòu)建崗位工種詞庫(kù);
步驟104,構(gòu)建特征向量矩陣;所述構(gòu)建特征向量矩陣包括:遍歷用工單位詞庫(kù)中新產(chǎn)生的用工單位,對(duì)每一個(gè)新用工單位,構(gòu)建用工單位詞庫(kù)對(duì)應(yīng)的特征向量矩陣其中Pp代表用工單位庫(kù)位置索引,Cp表示崗位工種位置索引,e為共現(xiàn)數(shù);
步驟105,共現(xiàn)頻率分析;
所述共現(xiàn)頻率分析包括:
(1)將所有評(píng)論裝載到文本集合Atext中;
(2)引入jieba分詞函數(shù),將評(píng)論Atext數(shù)據(jù)進(jìn)行分詞,定義詞庫(kù)鏈Awordn(w),其中:n=1表示名詞、n=2表示動(dòng)詞、n=3表示形容詞、n=4表示數(shù)量詞、n=5表示代詞、n=6表示副詞、n=7表示介詞、n=8表示連詞、n=9表示助詞、n=10表示嘆詞、n=11表示擬聲詞;W表示詞語(yǔ)的順序;Awordn(w)的值表示具體詞匯;
(3)對(duì)于詞庫(kù)鏈Awordn(w)中全部詞匯進(jìn)行詞頻分析,選取詞匯出現(xiàn)頻次超過(guò)閾值的詞匯,構(gòu)造詞庫(kù)鏈詞頻矩陣Awordn(w,c),其中n表示詞性,w表示詞匯位置,c表示詞語(yǔ)頻次;
(4)根據(jù)詞庫(kù)鏈詞頻矩陣Awordn(w,c)中c的數(shù)量大小,構(gòu)建完全二叉Huffman樹(shù),根據(jù)每個(gè)詞語(yǔ)對(duì)應(yīng)的位置,產(chǎn)生對(duì)應(yīng)的二進(jìn)制編碼k,構(gòu)建Huffman向量矩陣Hwordn(w,c,k),其中k用于保存二進(jìn)制編碼k;
(5)對(duì)于特征向量中pp用工單位的cp崗位工種,比對(duì)向量矩陣Hwordn(w,c,k),獲取pp用工單位的cp崗位工種對(duì)應(yīng)的二進(jìn)制編碼K1值,判斷向量矩陣Hwordn(w,c,k)中每個(gè)向量是否屬于用工單位崗位工種庫(kù)詞匯,如果屬于某個(gè)用工單位的cp崗位工種詞庫(kù),提取其對(duì)應(yīng)的Ki,利用余弦相似公式計(jì)算余弦距離,公式如下:
其中,j表示二進(jìn)制編碼K值的每個(gè)分量,選取余弦距離最近的前10個(gè)用工單位作為pp用工單位的cp崗位工種的共現(xiàn)詞,加入共現(xiàn)詞矩陣其中n表示詞性,w表示位置,c表示詞頻,k表示二進(jìn)制編碼值;將保存到中;
(6)對(duì)用工單位詞庫(kù)、崗位工種詞庫(kù)進(jìn)行更新;
步驟106,根據(jù)詞頻數(shù)據(jù)輸出展示共現(xiàn)頻率。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于河北冀聯(lián)人力資源服務(wù)集團(tuán)有限公司,未經(jīng)河北冀聯(lián)人力資源服務(wù)集團(tuán)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110369952.0/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 維修專(zhuān)用工具管理系統(tǒng)
- 人力資源需求中用工供給方的自動(dòng)推薦方法及系統(tǒng)
- 網(wǎng)絡(luò)用工交易方法、平臺(tái)和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 反滲透膜殼拆卸專(zhuān)用工具
- 一種區(qū)域勞動(dòng)力需求增量預(yù)測(cè)方法
- 根據(jù)求職狀態(tài)分發(fā)用工信息的方法及系統(tǒng)
- 自動(dòng)分發(fā)用工信息的方法及系統(tǒng)
- 流動(dòng)性工人信用評(píng)估方法和流動(dòng)性工人信用評(píng)估裝置
- 一種用工趨勢(shì)預(yù)測(cè)方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 倉(cāng)庫(kù)用工預(yù)測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 全球評(píng)論板系統(tǒng)及其實(shí)現(xiàn)方法
- 一種評(píng)論推薦方法和系統(tǒng)
- 評(píng)論內(nèi)容的提供方法、裝置和終端設(shè)備
- 評(píng)論信息確定方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 基于人工智能構(gòu)建評(píng)論圖譜的方法和裝置
- 一種電子商務(wù)產(chǎn)品評(píng)論質(zhì)量鑒別系統(tǒng)
- 音頻文件的評(píng)論方法及裝置
- 評(píng)論的展示方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 在線(xiàn)評(píng)論篩選裝置
- 用于生成評(píng)論的方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)





