[發明專利]文本語句相似度計算方法、智能政務輔助解答系統及其工作方法在審
| 申請號: | 201811253082.5 | 申請日: | 2018-10-25 |
| 公開(公告)號: | CN109460457A | 公開(公告)日: | 2019-03-12 |
| 發明(設計)人: | 吳瓊 | 申請(專利權)人: | 北京奧法科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06F17/27 |
| 代理公司: | 北京卓唐知識產權代理有限公司 11541 | 代理人: | 郭彩紅;李志剛 |
| 地址: | 100089 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語句相似度 咨詢問題 相似度計算 文本語句 相似度 分類 詞形相似度 語義相似度 語義 智能 加權相加 類相似度 在線咨詢 智能匹配 非在線 句子 匹配 客戶 | ||
1.一種文本語句相似度計算方法,包括,
計算包括但不限于兩個句子的語義相似度、長度相似度和詞形相似度中的至少兩類相似度;
其中,對于語義相似度,利用訓練出來的詞向量,將句子中每個詞的詞向量相加合成一個向量,作為句子的句向量,計算輸入的要比較的句向量與文本語句庫中每個待比較的句向量的余弦值,利用余弦相似度公式計算句向量間的相似度,作為兩個句子的語義相似度;
對于長度相似度len_sim(A,B),是指兩個句子,句子A和句子B的長度的相似度,計算公式為:
其中,len(A)表示句子A的長度,len(B)表示句子B的長度;
對于詞形相似度word_sim(A,B),是指兩個句子,句子A和句子B中相同的詞語共同出現的個數頻率;
將計算的包括兩類以上但不限于兩類或三類的相似度進行加權相加,得出語句相似度。
2.根據權利要求1所述的文本語句相似度計算方法,所述詞形相似度的計算公式為:
其中,same(A,B)表示句子A和句子B中同時出現的詞語的個數,num(A)表示句子A中包含的詞語的個數;num(B)表示句子B中包含的詞語的個數;m為常數因子,取值范圍為1.5到2.2。
3.根據權利要求1或2所述的文本語句相似度計算方法,進行加權相加,計算語句相似度的具體計算公式為:
sentence_sim(A,B)=λ1×syn_sim(A,B)+λ2×word_sim(A,B)+λ3×len_sim(A,B)
其中,syn_sim(A,B)為句子A和句子B的語義相似度;λ1為語義相似度的加權值;λ2為詞形相似度的加權值;λ3為長度相似度的加權值。
4.一種智能政務輔助解答系統工作方法,包括,
接收客戶端的咨詢問題;
對所述咨詢問題進行分類,分類包括在線咨詢問題和非在線咨詢問題;
根據分類安排解答模式;
其中,
非在線咨詢問題是指需要進行人工解答的問題;在線咨詢問題是指不需要人工解答,智能解答系統就能自動解答的問題;
智能解答系統自動解答過程中采用了權利要求1到3之一所述的文本語句相似度計算方法。
5.根據權利要求4所述的智能政務輔助解答系統工作方法,所述分類還包括政務專業問題和非專業問題分類;先進行在線咨詢問題和非在線咨詢問題分類,再進行政務專業問題和非專業問題分類;或,先進行政務專業問題和非專業問題分類,再進行在線咨詢問題和非在線咨詢問題分類;
其中,政務專業問題是指與政務相關的專業問題;非專業問題是指與政務不相關的問題。
6.根據權利要求5所述的智能政務輔助解答系統工作方法,根據分類安排解答模式的方法包括,如果是在線咨詢問題分類,則將咨詢問題發送給智能解答系統完成自動解答;如果是非在線咨詢問題分類,則將咨詢問題發送給人工解答系統;如果既屬于在線咨詢分類又屬于政務專業分類,則將咨詢問題發送給智能解答系統的政務專業解答模塊完成自動解答;如果既屬于在線咨詢分類又屬于非專業分類,則將咨詢問題發送給智能解答系統的非專業解答模塊完成自動解答;如果既屬于非在線咨詢分類又屬于政務專業分類,則將咨詢問題發送給人工解答系統的政務專業解答模塊;如果既屬于非在線咨詢分類又屬于非專業分類,則將咨詢問題發送給人工解答系統的非專業解答模塊。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奧法科技有限公司,未經北京奧法科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811253082.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種推薦學習內容的方法及裝置
- 下一篇:查詢改寫意圖的預測方法及裝置





