[發明專利]規則關聯模型的新概念發現方法及裝置在審
| 申請號: | 201710556964.8 | 申請日: | 2017-07-10 |
| 公開(公告)號: | CN107391638A | 公開(公告)日: | 2017-11-24 |
| 發明(設計)人: | 席麗娜;李德彥;王文軍 | 申請(專利權)人: | 北京神州泰岳軟件股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06N99/00 |
| 代理公司: | 北京弘權知識產權代理事務所(普通合伙)11363 | 代理人: | 逯長明,許偉群 |
| 地址: | 100089 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 規則 關聯 模型 新概念 發現 方法 裝置 | ||
1.一種規則關聯模型的新概念發現方法,其特征在于,包括:
獲取當前業務場景的訓練語料;
根據所述訓練語料生成推薦模型,所述推薦模型包括訓練詞匯表以及所述訓練詞匯表中每個詞匯的實數值向量;
獲取當前業務場景對應的規則關聯模型,并根據所述推薦模型確定與所述規則關聯模型中業務概念相對應的新概念;
將所述新概念添加到所述規則關聯模型中。
2.根據權利要求1所述的方法,其特征在于,所述獲取當前業務場景的訓練語料步驟,包括:
確定當前業務場景;
獲取所述當前業務場景的業務數據;
從所述業務數據中提取樣本數據,并將所述樣本數據作為所述訓練語料。
3.根據權利要求1所述的方法,其特征在于,所述根據所述訓練語料生成推薦模型,的步驟,包括:
對所述訓練語料進行逐條分詞生成分詞列表,并獲取停用詞匯表;
根據所述停用詞匯表,篩選所述分詞列表中的停用詞匯,并將所述停用詞匯移除分詞列表;
將篩選后的所述分詞列表確定為訓練詞匯表,并根據所述訓練詞匯表中的詞匯在所述訓練語料文本的位置生成詞空間向量模型;
根據所述詞空間向量模型確定所述訓練詞匯表中每個詞匯的實數值向量。
4.根據權利要求1所述的方法,其特征在于,所述獲取當前業務場景對應的規則關聯模型,并根據所述推薦模型確定與所述規則關聯模型中業務概念相對應的新概念的步驟,包括:
獲取所述當前業務場景的規則關聯模型,以及所述規則關聯模型中所有元組的業務概念;
根據所述推薦模型確定所述業務概念與所述訓練詞匯表中每個詞匯的所述實數值向量的關聯度;
根據所述關聯度對每個所述業務概念對應所有詞匯進行排序,確定新概念,并將所述新概念添加到所述規則關聯模型。
5.根據權利要求4所述的方法,其特征在于,所述根據所述關聯度對所述業務概念進行排序,確定新概念,并將所述新概念添加到所述規則關聯模型的步驟,包括:
根據所述關聯度,由大到小依次對所述詞匯進行排序,生成概念列表;
根據所述當前業務場景確定關聯度閾值,并對比所述概念列表中每個詞匯對應的關聯度與所述關聯度閾值;
如果所述詞匯未出現在所述規則關聯模型中,且所述詞匯對應的關聯度大于或等于所述關聯度閾值,則確定所述詞匯為新概念;
將所述新概念添加到所述規則關聯模型。
6.一種規則關聯模型的新概念發現裝置,其特征在于,包括:
數據輸入模塊,用于獲取當前業務場景的訓練語料;
推薦模型訓練模塊,用于根據所述訓練語料生成推薦模型,所述推薦模型包括訓練詞匯表以及所述訓練詞匯表中每個詞匯的實數值向量;
新概念推薦模塊,用于獲取當前業務場景對應的規則關聯模型,并根據所述推薦模型確定與所述規則關聯模型中業務概念相對應的新概念;
新概念添加模塊,用于將所述新概念添加到所述規則關聯模型中。
7.根據權利要求6所述的裝置,其特征在于,所述數據輸入模塊包括:
場景確定單元,用于確定當前業務場景;
業務數據獲取單元,用于獲取所述當前業務場景的業務數據;
樣本數據單元,用于從所述業務數據中提取樣本數據,并將所述樣本數據作為所述訓練語料。
8.根據權利要求6所述的裝置,其特征在于,所述推薦模型訓練模塊包括:
分詞單元,用于對所述訓練語料進行逐條分詞生成分詞列表,并獲取停用詞匯表;
詞匯篩選單元,用于根據所述停用詞匯表,篩選所述分詞列表中的停用詞匯,并將所述停用詞匯移除分詞列表;
空間向量模型單元,用于將篩選后的所述分詞列表確定為訓練詞匯表,并根據所述訓練詞匯表中的詞匯在所述訓練語料文本中的位置生成詞空間向量模型;
實數值向量單元,用于根據所述詞空間向量模型確定所述訓練詞匯表中每個詞匯的實數值向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京神州泰岳軟件股份有限公司,未經北京神州泰岳軟件股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710556964.8/1.html,轉載請聲明來源鉆瓜專利網。





