日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于機器學習和模糊規(guī)則的集成簡歷信息抽取方法在審

專利信息
申請?zhí)枺?/td> 201911217801.2 申請日: 2019-12-03
公開(公告)號: CN110941703A 公開(公告)日: 2020-03-31
發(fā)明(設計)人: 宋萬軍;郭曉杰;王崢;李曙光;王黎黎;高永偉;陳白雪;姜廣棟;楊萬剛;李峰 申請(專利權)人: 南京烽火星空通信發(fā)展有限公司
主分類號: G06F16/33 分類號: G06F16/33;G06F16/35;G06F16/383;G06F40/216;G06F40/289;G06N7/02;G06N20/00;G06Q10/10
代理公司: 南京經(jīng)緯專利商標代理有限公司 32200 代理人: 曹佩佩
地址: 210019 江蘇省南京市建*** 國省代碼: 江蘇;32
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 機器 學習 模糊 規(guī)則 集成 簡歷 信息 抽取 方法
【說明書】:

發(fā)明公開了一種基于機器學習和模糊規(guī)則的集成簡歷信息抽取方法,包括:抽取簡歷、疑似簡歷和非簡歷文本的特征,通過特征信息,篩選簡歷文本;對篩選得到的簡歷文本進行詞頻統(tǒng)計,獲取常用關鍵詞并生成模糊匹配規(guī)則;使用模糊匹配規(guī)則對簡歷文本進行切分,并抽樣檢查分塊結果,驗證分塊的正確率;針對簡歷文本切分后各個分塊的數(shù)據(jù)分布特征,采用模糊匹配規(guī)則、序列標注或者分類的方法抽取簡歷文本具體的信息;使用訂正策略對不合理的結果進行訂正并輸出結構化的簡歷信息。本發(fā)明有效的解決容了簡歷信息抽取過程易受無效信息干擾、分詞粒度過小和實體指代不明的問題。

技術領域

本發(fā)明公開了一種基于機器學習和模糊規(guī)則的集成簡歷信息抽取方法,涉及自然語言處理中的信息抽取技術領域。

背景技術

在現(xiàn)有技術中,目前簡歷信息抽取技術常見的包括以下三種方法:1、使用統(tǒng)計分析和規(guī)則匹配抽取簡歷信息;2、使用機器學習算法抽取簡歷信息;3、使用規(guī)則和機器學習的組合的方法抽取信息。

方法1屬于傳統(tǒng)的抽取方法。首先統(tǒng)計出詞頻較高的標題詞,如:姓名、電話、畢業(yè)院校、公司名稱等。然后針對統(tǒng)計出的高頻詞或者期望提取的詞,制定提取規(guī)則,實現(xiàn)信息的抽取。該方法雖然抽取的信息較準確,但能抽取的信息有限,規(guī)則不能覆蓋到的數(shù)據(jù)將會丟失。

方法2通過將信息抽取問題抽象為序列標注問題,使用隱馬爾可夫鏈(HMM)、條件隨機場(CRF)、長短期記憶網(wǎng)絡(LSTM)以及深度學習的方法抽取信息。該方法對規(guī)整的文本,抽取的效果較為明顯。但簡歷數(shù)據(jù)格式繁雜,如:doc、docx、html、pdf等,將簡歷轉換成凈文本格式后,文本中可能含有錯行、無效換行、無效字符等情況,此時單純的使用機器學習方法抽取的效果較差。

方法3將規(guī)則匹配和機器學習方法組合起來抽取信息。該方法首先使用規(guī)則對固定格式的數(shù)據(jù)進行抽取,如:手機號、郵箱、生日、工作年限等,然后通過機器學習的方法抽取其它信息,如:個人其它基本信息、工作教育信息等。該方法是目前簡歷信息抽取的主流方法。但仍然存在容易受無效信息干擾、實體指代不明以及分詞粒度過小的問題。無法規(guī)避非簡歷信息的干擾;簡歷中出現(xiàn)多個姓名時,無法確定簡歷作者本人的姓名;工作經(jīng)歷和教育經(jīng)歷中都出現(xiàn)學校名稱時,無法區(qū)分該名稱是工作單位還是學習學校;對于時間段

1988.06-1982.09,無法區(qū)分是學習時間段還是工作時間段等等。

發(fā)明內(nèi)容

本發(fā)明所要解決的技術問題是:針對現(xiàn)有技術的缺陷,提供一種基于機器學習和模糊規(guī)則的集成簡歷信息抽取方法,

本發(fā)明為解決上述技術問題采用以下技術方案:

一種基于機器學習和模糊規(guī)則的集成簡歷信息抽取方法,所述方法包括如下步驟:

步驟一、抽取簡歷、疑似簡歷和非簡歷文本的特征,通過特征信息,篩選簡歷文本;

步驟二、對篩選得到的簡歷文本進行詞頻統(tǒng)計,獲取常用關鍵詞并生成模糊匹配規(guī)則;

步驟三、使用模糊匹配規(guī)則對簡歷文本進行切分,并抽樣檢查分塊結果,驗證分塊的正確率;

步驟四、針對簡歷文本切分后各個分塊的數(shù)據(jù)分布特征,采用模糊匹配規(guī)則、序列標注或者分類的方法抽取簡歷文本具體的信息;

步驟五、使用訂正策略對不合理的結果進行訂正并輸出結構化的簡歷信息。

作為本發(fā)明的進一步優(yōu)選方案,所述步驟一的方法具體包括:

101、標注簡歷、疑似簡歷以及非簡歷樣本;

102、使用特征抽取器抽取上述3類樣本的特征,并訓練分類模型;

103、輸入文本到模型,輸出簡歷、疑似簡歷、非簡歷三者之一。

下載完整專利技術內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京烽火星空通信發(fā)展有限公司,未經(jīng)南京烽火星空通信發(fā)展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201911217801.2/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術的結構示意圖、流程工藝圖技術構造圖;

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产1区2区视频| 欧美日韩一级在线观看| 精品国产一区二区在线| 久久乐国产精品| 国产精品久久久不卡| 免费a一毛片| 少妇高潮ⅴideosex| 久久综合伊人77777麻豆最新章节| 亚洲欧洲一区| 国产欧美日韩在线观看| 国产视频二区在线观看| 久久婷婷国产综合一区二区| 91麻豆精品一区二区三区| 亚洲欧洲日韩| 国产乱老一区视频| 欧美日韩国产色综合一二三四| 亚洲精品久久久久999中文字幕 | 中文字幕久久精品一区| 男女午夜影院| 久久国产精品视频一区| 国产精品一区二| 久久午夜无玛鲁丝片午夜精品| 国产精一区二区三区| 亚洲四区在线| 亚洲国产精品第一区二区| 国产午夜三级一区二区三| 99国产精品免费| 国产欧美亚洲精品| 国产色午夜婷婷一区二区三区| 中文文精品字幕一区二区| 国产一区二区在线观看免费| 精品免费久久久久久久苍| 91免费国产视频| 久久一区二区三区欧美| 国产精品欧美一区二区三区| 国产91一区二区在线观看| 日韩精品中文字幕一区二区三区| 国产精品国产三级国产专区53| 日韩av在线高清| 国产精品入口麻豆九色| 亚洲乱小说| 国产伦精品一区二区三区免| 国产一区三区四区| 日韩精品一二区| 久久综合伊人77777麻豆最新章节| 日韩av中文字幕在线免费观看| 国产亚洲精品久久久久动| 欧美xxxxxhd| 久久二区视频| 欧美三级午夜理伦三级中视频| 农村妇女毛片精品久久| 在线观看v国产乱人精品一区二区| 7799国产精品久久99| 中文字幕一区二区三区免费视频| 国产精品久久久久久久综合| 国产91在线拍偷自揄拍| 久久久久久久久亚洲精品一牛| 99精品一区| 国产精品色婷婷99久久精品| 爱看av在线入口| 国产伦精品一区二区三区免| 999久久久国产| a级片一区| 91麻豆文化传媒在线观看| 91精品综合在线观看| 国产在线视频99| 91精品久久久久久久久久| 中文字幕视频一区二区| 中文字幕在线乱码不卡二区区| 97精品国产97久久久久久粉红| 欧美日韩亚洲另类| 性欧美一区二区| 国产日韩欧美精品一区二区| 亚洲国产一二区| 久久久久久久国产精品视频| 国产高潮国产高潮久久久91| 奇米色欧美一区二区三区| 国产午夜精品一区| 精品国产乱码久久久久久久| 国产区一区| 国产精品9区| 午夜亚洲影院| 91久久国语露脸精品国产高跟| 在线精品国产一区二区三区88| 国产第一区在线观看| 亚洲精品乱码久久久久久按摩| 亚洲国产精品国自产拍av| 大bbw大bbw巨大bbb| 国产精品一区二区免费视频| 国产91清纯白嫩初高中在线观看 | 国产精品日韩电影| 久久九精品| 国产一区二区三区午夜| 国产欧美亚洲精品第一区软件| 99精品黄色| 99精品国产99久久久久久97| 国产欧美一区二区三区精品观看| 亚洲二区在线播放视频| 久久精品亚洲一区二区三区画质| 国产一区二区电影在线观看| 久久九九国产精品| 久久伊人色综合| 欧美一区二区三区在线免费观看| 91精品一二区| 欧美乱妇高清无乱码| 国产精品你懂的在线| 国产无套精品久久久久久| 亚洲自拍偷拍中文字幕| 国产日韩欧美亚洲| 国产一区二三| 精品国产一区二区三区国产馆杂枝| 狠狠色丁香久久综合频道日韩| 国产视频一区二区在线播放| 久久不卡一区| 99久热精品| 国产麻豆精品一区二区| 欧美一区二区三区激情在线视频| 免费xxxx18美国| 电影91久久久| 欧美精选一区二区三区| 99国产精品99久久久久| 91偷拍网站| 国产日韩一区在线| 国产精品女同一区二区免费站| 国产精品久久久久免费a∨大胸| 日韩精品久久一区二区三区| 国产香蕉97碰碰久久人人| 午夜毛片在线| 日本高清一二区| 久久国产免费视频| 丰满岳乱妇bd在线观看k8| 国产精品视频久久久久久| 国产91九色视频| 91人人爽人人爽人人精88v| 国产乱人乱精一区二视频国产精品| 国产一级片一区| 色婷婷综合久久久久中文| 91久久精品国产亚洲a∨麻豆 | 香港日本韩国三级少妇在线观看| 艳妇荡乳欲伦2| 国产在线不卡一| 亚洲精品国产setv| 亚洲国产精品一区二区久久,亚洲午夜| 欧美在线视频一区二区三区| 91一区二区在线观看| 欧美一区二区三区四区在线观看| 国产欧美一区二区三区在线看| 搡少妇在线视频中文字幕| 午夜av资源| 亚洲欧洲日韩av| 日本一区二区免费电影| 欧美激情综合在线| 国产一区二区伦理| 午夜影院5分钟| 欧美日韩高清一区二区| 久久久久国产精品www| 亚洲国产精品日本| 国产一区二区三区精品在线| 国产精品不卡一区二区三区| 野花社区不卡一卡二| 少妇高潮ⅴideosex| 亚洲久色影视| 亚洲午夜精品一区二区三区电影院| 国产91在线拍偷自揄拍| 久久福利免费视频| 91一区二区三区视频| 久久96国产精品久久99软件| 国产视频一区二区三区四区| xxxx18hd护士hd护士| 久久99国产综合精品| 视频一区二区国产| 99欧美精品| 在线国产二区| 国产91丝袜在线播放动漫| 91九色精品| 久久影院国产精品| 国产精品久久99| 精品国产乱码久久久久久a丨| 午夜精品一二三区| 国产九九影院| 国产伦精品一区二区三区免费迷| 年轻bbwbbw高潮| 久久精品综合| 国产日韩欧美第一页| 国产高清精品一区| 国产日韩欧美网站| 99精品偷拍视频一区二区三区| 国产97免费视频| 欧美日韩一区二区三区在线播放| 久久激情图片| 久久一二区| 日韩亚洲欧美一区| 国产精品一区在线观看| 91看片片| 91精品国产91热久久久做人人| 亚洲国产视频一区二区三区| 99精品一区| 一区二区三区欧美视频| 色妞www精品视频| 91精品丝袜国产高跟在线| 99精品国产免费久久| 综合色婷婷一区二区亚洲欧美国产| 97久久精品人人澡人人爽| 中文字幕国内精品| 日韩一级片免费视频| 国产午夜精品一区理论片飘花 | 国产一区二区大片| 精品少妇的一区二区三区四区| 91亚洲欧美日韩精品久久奇米色 | 国产精品久久久区三区天天噜| 午夜电影理伦片2023在线观看| 色天天综合久久久久综合片| 狠狠插影院| 久久二区视频| 欧美亚洲国产日韩| 日韩欧美视频一区二区| 免费午夜在线视频| 91精品啪在线观看国产| 自拍偷在线精品自拍偷无码专区| 97国产精品久久久| 在线国产一区二区三区| 久久乐国产精品| 久久精品综合| 免费a级毛片18以上观看精品| 国产一区不卡视频| 国产精品18久久久久久白浆动漫| 国产精品高潮在线| 日本一区二区三区中文字幕 | 天天干狠狠插| 在线视频国产一区二区| 99久久精品免费看国产免费粉嫩| 亚洲国产精品一区在线| 久久精品亚洲一区二区三区画质| 国产91热爆ts人妖在线| 一二三区欧美| av午夜影院| 欧美日韩国产在线一区二区三区| 亚洲欧美日韩国产综合精品二区 | 国产原创一区二区| 日本福利一区二区| 午夜三级大片| 日韩中文字幕亚洲精品欧美| 日韩精品免费一区二区中文字幕| 九九热国产精品视频| 日韩精品一区二区免费| 国产精品久久久久久久综合|