[發(fā)明專利]一種基于機器學習的能力模型與工單匹配方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 201911407744.4 | 申請日: | 2019-12-31 |
| 公開(公告)號: | CN111144113A | 公開(公告)日: | 2020-05-12 |
| 發(fā)明(設(shè)計)人: | 丁志龍;甘松云;余眾澤 | 申請(專利權(quán))人: | 安徽智恒信科技股份有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/30;G06F40/242;G06F16/31;G06Q10/06;G06N20/00 |
| 代理公司: | 安徽知問律師事務所 34134 | 代理人: | 代群群 |
| 地址: | 230088 安徽省合肥市高*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 機器 學習 能力 模型 匹配 方法 系統(tǒng) | ||
1.一種基于機器學習的能力模型與工單匹配方法,其特征在于,包括以下步驟:
S100、對工單進行分詞處理得到準分詞結(jié)果,根據(jù)準分詞結(jié)果生成特征項,根據(jù)特征項建立特征項數(shù)據(jù)庫;
S200、根據(jù)特征項數(shù)據(jù)庫生成特征項-需求文檔矩陣,建立隱性語義索引數(shù)據(jù)庫;
S300、對專業(yè)詞典中的特征項進行技術(shù)領(lǐng)域?qū)傩詣澐?,將特征項打上技術(shù)領(lǐng)域標簽,對特征項賦予權(quán)值,生成技術(shù)能力模型,將現(xiàn)有工單進行準分詞和相似度匹配處理,得到特征項,通過特征項計算出技術(shù)領(lǐng)域能力值,將能力值帶入技術(shù)能力模型進行訓練完善;
S400、當系統(tǒng)獲得新工單時,對該工單進行準分詞和相似度匹配處理,生成工單的特征項,將特征項與技術(shù)能力模型進行匹配。
2.根據(jù)權(quán)利要求1所述的一種基于機器學習的能力模型與工單匹配方法,其特征在于,所述步驟S100中對需求文檔進行分詞處理得到準分詞結(jié)果,根據(jù)準分詞結(jié)果生成特征項包括以下步驟:
S101、遍歷工單中的需求文檔和技術(shù)文檔,對文檔進行準分詞處理得到準分詞結(jié)果;
S102、建立包括專業(yè)詞匯的專業(yè)詞典;
S103、將專業(yè)詞典中的專業(yè)詞匯與準分詞結(jié)果進行相似度匹配,如果相似度匹配得到的相似度超過設(shè)定閾值的分詞結(jié)果,則生成特征項,否則進行下一個準分詞結(jié)果的匹配。
3.根據(jù)權(quán)利要求1所述的一種基于機器學習的能力模型與工單匹配方法,其特征在于:所述步驟S200根據(jù)特征項數(shù)據(jù)庫生成特征項-需求文檔矩陣,建立隱性語義索引數(shù)據(jù)庫包括以下步驟:
S201、基于標引矩陣生成技術(shù),結(jié)合特征項數(shù)據(jù)庫中的特征項和工單中的需求文檔,生成特征項-需求文檔矩陣;
S202、對矩陣進行奇異值分解,并剔除不符合標準的奇異值;
S203、根據(jù)篩選后奇異值生成隱性語義索引數(shù)據(jù)庫。
4.根據(jù)權(quán)利要求1所述的一種基于機器學習的能力模型與工單匹配方法,其特征在于,所述步驟S300中將特征項打上技術(shù)領(lǐng)域標簽,對特征項賦予權(quán)值包括以下步驟:
S301、讀取專業(yè)詞典的專業(yè)詞匯,選取專業(yè)詞匯中的技術(shù)領(lǐng)域相關(guān)詞匯,生成技術(shù)領(lǐng)域標簽;
S302、將特征項關(guān)聯(lián)技術(shù)領(lǐng)域標簽,使特征項與技術(shù)領(lǐng)域標簽建立映射關(guān)系;
S303、根據(jù)特征項與對應標簽的實際關(guān)聯(lián)性對映射關(guān)系進行權(quán)值計算。
5.根據(jù)權(quán)利要求1所述的一種基于機器學習的能力模型與工單匹配方法,其特征在于,所述步驟S400中生成工單的隱性語義特征項包括以下步驟:
S401、將該工單的需求文檔與索引數(shù)據(jù)庫中其他包含相同特征項或部分特征項的需求文檔進行比對,以確定不同特征文檔之間的語義相關(guān)性以及需求文檔與特征項之間的相關(guān)性;
S402、將該需求文檔與具有高語義相關(guān)性的需求文檔進行比對,從中找出特定需求文檔中存在的隱性特征項。
S403、根據(jù)特征項與隱性特征項,計算技術(shù)領(lǐng)域需求值;
S404、將技術(shù)領(lǐng)域需求值與技術(shù)能力模型進行匹配。
6.一種基于機器學習的技術(shù)人員能力模型與工單匹配系統(tǒng),其特征在于,包括:
特征項生成單元,用于對工單進行分詞處理得到準分詞結(jié)果,根據(jù)準分詞結(jié)果生成特征項,根據(jù)特征項建立特征項數(shù)據(jù)庫;
隱性語義索引生成單元,根據(jù)特征項數(shù)據(jù)庫生成特征項-需求文檔矩陣,對矩陣進行奇異值分解,生成隱性語義索引數(shù)據(jù)庫;
模型訓練單元,對專業(yè)詞典中的特征項進行技術(shù)領(lǐng)域?qū)傩詣澐郑瑢⑻卣黜棿蛏霞夹g(shù)領(lǐng)域標簽,對特征項賦予權(quán)值,生成技術(shù)能力模型,將現(xiàn)有工單進行準分詞和相似度匹配處理,得到特征項,通過特征項計算出技術(shù)領(lǐng)域能力值,將能力值帶入技術(shù)能力模型進行訓練完善;
能力匹配單元,當系統(tǒng)獲得新工單時,對該工單進行準分詞和相似度匹配處理,生成工單的特征項和隱性語義特征項,根據(jù)特征項和隱性語義特征項計算技術(shù)領(lǐng)域需求值,與模型訓練單元中的技術(shù)能力模型進行匹配。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于安徽智恒信科技股份有限公司,未經(jīng)安徽智恒信科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911407744.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





