[發明專利]用于語義解析的方法和系統有效
| 申請號: | 201710015977.4 | 申請日: | 2017-01-10 |
| 公開(公告)號: | CN108287848B | 公開(公告)日: | 2020-09-04 |
| 發明(設計)人: | 董宇 | 申請(專利權)人: | 中國移動通信集團貴州有限公司;中國移動通信集團公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33 |
| 代理公司: | 北京東方億思知識產權代理有限責任公司 11258 | 代理人: | 彭瓊 |
| 地址: | 550001 貴*** | 國省代碼: | 貴州;52 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 語義 解析 方法 系統 | ||
1.一種用于語義解析的方法,包括:
獲得用戶發送的文本信息中包含的一個或多個特征詞;
從預先構建的特征概率庫中獲取所述一個或多個特征詞中的每個特征詞針對所述特征概率庫中的每個分類業務的特征概率;
基于所獲得的每個特征詞針對每個分類業務的特征概率獲得所述文本信息針對該分類業務的聯合概率,并將所述文本信息關聯到特征概率庫中的一個或多個分類業務;
獲得所述文本信息與相關聯的所述一個或多個分類業務下的所有知識條目中的每個知識條目的相似度,并將所述文本信息匹配到相似度最高的知識條目;
其中,獲得所述文本信息與相關聯的所述一個或多個分類業務下的所有知識條目中的每個知識條目的相似度包括:
把所述文本信息的一個或多個特征詞抽象成與該文本信息相對應的知識點向量;
通過詞頻-逆文檔頻率算法獲得所述知識點向量在所述一個或多個分類業務中的總權重向量,以及所述知識點向量在該知識條目中的知識條目權重向量;
基于所述總權重向量和所述知識條目權重向量通過向量空間算法獲得所述文本信息與該知識條目的相似度。
2.如權利要求1所述的方法,還包括將所述相似度最高的知識條目作為結果提供給所述用戶。
3.如權利要求1所述的方法,所述獲得用戶發送的文本信息中包含的一個或多個特征詞包括:
對用戶發送的自然語言問句進行分詞處理,獲取候選特征詞集;
根據預先設置的停用詞表對獲取的候選特征詞集進行過濾處理,得到所述一個或多個特征詞。
4.如權利要求1所述的方法,其中,構建所述特征概率庫包括:
采集訓練樣本數據集;
對訓練樣本數據集中的樣本數據與所述特征概率庫中的分類業務進行匹配,獲取匹配成功的樣本數據以及對應的分類業務,在特征概率庫中建立分類業務存儲區,存儲與分類業務匹配成功的樣本數據;
在分類業務存儲區中,獲取樣本數據中包含的詞條,統計詞條在分類業務中的文檔頻率DF;
將DF值超過預先設置的分類業務DF閾值的詞條作為特征詞存入分類業務存儲區;
計算特征詞在分類業務中的特征指示概率;
根據特征指示概率計算該特征詞的特征概率,并存入分類業務存儲區中,建立特征詞與特征概率的特征概率庫。
5.如權利要求1所述的方法,所述文本信息針對每個分類業務的特征聯合概率等于所述一個或多個特征中每個特征的特征概率的乘積除以以下兩項之和:所述一個或多個特征中每個特征的特征概率的乘積、以及所述一個或多個特征中每個特征的特征概率的逆的乘積。
6.如權利要求1所述的方法,其中,所述文本信息與其所關聯到的所述一個或多個分類業務的聯合概率高于預定聯合概率閾值。
7.一種用于語義解析的系統,包括:
特征詞獲得模塊,被配置為獲得用戶發送的文本信息中包含的一個或多個特征詞;
特征概率庫構建模塊,被配置為從預先構建的特征概率庫中獲取所述一個或多個特征詞中的每個特征詞針對所述特征概率庫中的每個分類業務的特征概率;
關聯分類確定模塊,被配置為基于所獲得的每個特征詞針對每個分類業務的特征概率獲得所述文本信息針對該分類業務的聯合概率,并將所述文本信息關聯到特征概率庫中的一個或多個分類業務;
目標確定模塊,被配置為獲得所述文本信息與相關聯的所述一個或多個分類業務下的所有知識條目中的每個知識條目的相似度,并將所述文本信息匹配到相似度最高的知識條目;
其中,所述目標確定模塊包括:
知識點向量獲得單元,被配置為把所述文本信息的一個或多個特征詞抽象成與該文本信息相對應的知識點向量;
權重計算單元,被配置為通過詞頻-逆文檔頻率算法獲得所述知識點向量在所述一個或多個分類業務中的總權重向量,以及所述知識點向量在該知識條目中的知識條目權重向量;
相似度計算單元,被配置為基于所述總權重向量和所述知識條目權重向量通過向量空間算法獲得所述文本信息與該知識條目的相似度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國移動通信集團貴州有限公司;中國移動通信集團公司,未經中國移動通信集團貴州有限公司;中國移動通信集團公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710015977.4/1.html,轉載請聲明來源鉆瓜專利網。





