[發明專利]一種異常訪談記錄文本的確定方法及裝置有效
| 申請號: | 201810239374.7 | 申請日: | 2018-03-22 |
| 公開(公告)號: | CN108376178B | 公開(公告)日: | 2020-08-11 |
| 發明(設計)人: | 徐振中;肖依永;苑星龍 | 申請(專利權)人: | 北京航空航天大學 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/2458;G06F40/284;G06F40/216 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 吳迪 |
| 地址: | 100083*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 異常 訪談 記錄 文本 確定 方法 裝置 | ||
1.一種異常訪談記錄文本的確定方法,其特征在于,包括:
獲取每位待評價目標對應的訪談記錄文本集,所述訪談記錄文本集包括多條訪談記錄文本;
計算每位待評價的目標對應的訪談記錄文本集中的兩兩訪談記錄文本之間的相似度;
基于所述訪談記錄文本集個數、每個訪談記錄文本集中的訪談記錄文本條數以及每個訪談記錄文本集中兩兩訪談記錄文本之間的相似度,確定每位所述目標的訪談記錄文本集是否異常;
所述基于所述訪談記錄文本集個數、每個訪談記錄文本集中的訪談記錄文本條數以及每個訪談記錄文本集中兩兩訪談記錄文本之間的相似度,確定每位所述目標的訪談記錄文本集是否異常,包括:
根據所述訪談記錄文本集個數以及每一訪談記錄文本集包含的訪談記錄文本條數,獲取訪談記錄文本總條數;
基于所述總條數、每個所述訪談記錄文本集中兩兩訪談記錄文本之間的相似度,確定所有訪談記錄文本集的總平均分值;
基于任意一個訪談記錄文本集中的訪談記錄文本條數,以及該訪談記錄文本集中兩兩訪談記錄文本之間的相似度,確定所述任意一個訪談記錄文本集的平均分值;
若訪談記錄文本集的平均分值大于所述總平均分值,確定該訪談記錄文本集中所有訪談記錄文本均為異常文本。
2.根據權利要求1所述的方法,其特征在于,所述計算每位待評價的目標對應的訪談記錄文本集中的兩兩訪談記錄文本之間的相似度,包括:
基于預設的相似度衡量模型,對任意一條訪談記錄文本進行向量轉換,得到該任意一條訪談記錄文本的訪談向量;
計算任意兩個訪談向量之間的余弦值,通過所述余弦值來記錄所述任意兩個訪談記錄向量之間的相似度。
3.根據權利要求2所述的方法,其特征在于,所述基于預設的相似度衡量模型,對任意一條訪談記錄文本進行向量轉換之前,還包括:
對所述任意一條訪談記錄文本進行分詞處理;
過濾掉進行分詞處理后的所述任意一條訪談記錄文本中的停用詞,得到關鍵詞。
4.根據權利要求3所述的方法,其特征在于,所述基于預設的相似度衡量模型,對任意一條訪談記錄文本進行向量轉換,包括:
對于所述任意一條訪談記錄文本,依次將該任意一條訪談記錄文本中的各關鍵詞轉換為對應的數字信息;
基于依次轉換得到的所述數字信息,生成該任意一條訪談記錄文本對應的訪談向量。
5.一種異常訪談記錄文本的確定裝置,其特征在于,包括:
獲取模塊,用于獲取每位待評價目標對應的訪談記錄文本集,所述訪談記錄文本集包括多條訪談記錄文本;
計算模塊,用于計算每位待評價的目標對應的訪談記錄文本集中的兩兩訪談記錄文本之間的相似度;
確定模塊,用于基于所述訪談記錄文本集個數、每個訪談記錄文本集中的訪談記錄文本條數以及每個訪談記錄文本集中兩兩訪談記錄文本之間的相似度,確定每位所述目標的訪談記錄文本集是否異常;
所述確定模塊,具體用于:
根據所述訪談記錄文本集個數以及每一訪談記錄文本集包含的訪談記錄文本條數,獲取訪談記錄文本總條數;
基于所述總條數、每個所述訪談記錄文本集中兩兩訪談記錄文本之間的相似度,確定所有訪談記錄文本集的總平均分值;
基于任意一個訪談記錄文本集中的訪談記錄文本條數,以及該訪談記錄文本集中兩兩訪談記錄文本之間的相似度,確定所述任意一個訪談記錄文本集的平均分值;
若訪談記錄文本集的平均分值大于所述總平均分值,確定該訪談記錄文本集中所有訪談記錄文本均為異常文本。
6.根據權利要求5所述的裝置,其特征在于,所述計算模塊,具體用于:
基于預設的相似度衡量模型,對任意一條訪談記錄文本進行向量轉換,得到該任意一條訪談記錄文本的訪談向量;
計算任意兩個訪談向量之間的余弦值,通過所述余弦值來記錄所述任意兩個訪談記錄向量之間的相似度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學,未經北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810239374.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于處理信息的方法和分布式系統
- 下一篇:車輛信息查詢方法、系統及存儲介質





