[發(fā)明專利]基于文本履歷信息的信息可視化方法及智能可視分析系統有效
| 申請?zhí)枺?/td> | 201410496047.1 | 申請日: | 2014-09-25 |
| 公開(公告)號: | CN104318340B | 公開(公告)日: | 2017-07-07 |
| 發(fā)明(設計)人: | 王浩;張晨;徐帆江;王微 | 申請(專利權)人: | 中國科學院軟件研究所 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06F17/30 |
| 代理公司: | 北京君尚知識產權代理事務所(普通合伙)11200 | 代理人: | 司立彬 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 文本 履歷 信息 可視化 方法 智能 可視 分析 系統 | ||
1.一種基于文本履歷信息的信息可視化方法,其步驟為:
1)對每一文本履歷信息中的經歷信息,進行經歷等級量化計算,得到成長軌跡序列數據,并將該數據進行可視化;
2)選取多份文本履歷信息的成長軌跡序列數據進行關聯計算,得到文本履歷間的潛在社交關系,并將該潛在社交關系進行社交網絡可視化;
3)基于履歷間的潛在社交關系,構建人員所在單位的組織層級可視化表達,將具有單位交集的履歷轉化成相應單位的組織層級關系,并將該組織層級關系進行組織機構可視化;
其中,所述基于履歷間的潛在社交關系,構建人員所在單位的組織層級的組織機構可視化方法為:
31)將所述潛在社交關系記錄為一矩陣R,矩陣元素Rij代表履歷Mi和履歷Mj之間的潛在社交關系;
32)建立一組織機構庫V,用于保存所有的組織機構及其成員信息;其中庫中元素為樹狀結構,樹的根節(jié)點為組織名稱,葉節(jié)點為成員信息,其具體結構為:<組織名稱,<成員1,職務1,是否現任>,<成員2,職務2,是否現任>,…,<成員m,職務m,是否現任>>;
33)遍歷矩陣R,如果Rij所代表的履歷Mi和履歷Mj存在單位交集,則將該單位以及履歷Mi和履歷Mj保存至該組織機構庫V;
34)將V中的所有元素按照所述樹狀結構,采用組織機構可視化方法進行可視化表達。
2.如權利要求1所述的方法,其特征在于如果履歷為非結構化文本履歷,則首先將其轉換為結構化的文本履歷信息,其方法為:
1)對非結構化文本履歷進行格式過濾,獲得包含履歷信息的純履歷文本;
2)利用自然語言處理技術對純履歷文本進行分詞與命名實體識別,然后進行履歷特征要素抽取,處理得到包含履歷要素的結構化文本塊;
3)將包含履歷要素的結構化文本塊進行格式轉化,形成結構化的文本履歷信息。
3.如權利要求2所述的方法,其特征在于所述結構化的文本履歷信息包括:履歷基本信息和經歷信息表;所述履歷基本信息包括姓名、性別、民族和出生地,所述經歷信息表為一個表結構,表頭包含開始時間、終止時間、地點、單位、職務字段。
4.如權利要求3所述的方法,其特征在于對于單位履歷特征要素,采用關鍵字匹配算法進行履歷特征要素的抽取:首先創(chuàng)建一單位關鍵詞詞典,所述單位關鍵詞詞典中每一行元素包括關鍵字和輔助關鍵字兩部分信息,其中,輔助關鍵字包括R型和L型兩種,多個輔助關鍵字用逗號相隔;然后利用單位關鍵詞詞典進行單位要素識別:當識別到了詞典中的某一關鍵字,且其右側無R型輔助關鍵字,同時左側無L型輔助關鍵字時,則識別成功;反之,識別失敗;對于其他履歷特征要素,采取正則表達式匹配法進行履歷特征要素的抽取。
5.如權利要求3所述的方法,其特征在于得到所述成長軌跡序列數據的方法為:
1)對每一文本履歷信息的經歷信息表按照開始時間字段進行升序排序,得到有序經歷信息表;
2)逐條掃描有序經歷信息表中的記錄,從每一條記錄中提取出地點、單位與職務字段,并將各個字段值分別與已有的經歷等級量化庫進行比對識別,對匹配的實體賦予設定的量化量級;
3)將包含不同量級大小的經歷段集合組成有序序列,得到所述成長軌跡序列數據。
6.如權利要求1或5所述的方法,其特征在于所述成長軌跡序列數據為一六元組,即<起始時間,終止時間,地點,單位,職務,量化等級>。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院軟件研究所,未經中國科學院軟件研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410496047.1/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規(guī)劃、調度或分配時間、人員或機器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





