[發(fā)明專利]基于語義匹配的問題處理方法、裝置、終端和存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202011614093.9 | 申請(qǐng)日: | 2020-12-29 |
| 公開(公告)號(hào): | CN112632257A | 公開(公告)日: | 2021-04-09 |
| 發(fā)明(設(shè)計(jì))人: | 楊智威 | 申請(qǐng)(專利權(quán))人: | 深圳賽安特技術(shù)服務(wù)有限公司 |
| 主分類號(hào): | G06F16/332 | 分類號(hào): | G06F16/332;G06F16/33;G06F40/30;G06K9/62 |
| 代理公司: | 廣州三環(huán)專利商標(biāo)代理有限公司 44202 | 代理人: | 熊永強(qiáng) |
| 地址: | 518000 廣東省深圳市前海深港合作區(qū)前*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 語義 匹配 問題 處理 方法 裝置 終端 存儲(chǔ) 介質(zhì) | ||
1.一種基于語義匹配的問題處理方法,其特征在于,所述方法包括:
獲取待分析問題;
對(duì)所述待分析問題進(jìn)行處理,得到所述待分析問題的標(biāo)簽;
獲取所述標(biāo)簽對(duì)應(yīng)的標(biāo)準(zhǔn)問題集合,并確定所述待分析問題與所述標(biāo)準(zhǔn)問題集合中各個(gè)標(biāo)準(zhǔn)問題之間的語義相似度;
基于所述待分析問題與所述標(biāo)準(zhǔn)問題集合中各個(gè)標(biāo)準(zhǔn)問題之間的語義相似度,從所述標(biāo)準(zhǔn)問題集合中篩選出目標(biāo)標(biāo)準(zhǔn)問題;
基于所述目標(biāo)標(biāo)準(zhǔn)問題對(duì)應(yīng)的目標(biāo)答案確定所述待分析問題對(duì)應(yīng)的答案,并將所述待分析問題對(duì)應(yīng)的答案進(jìn)行顯示。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述待分析問題進(jìn)行處理,得到所述待分析問題的標(biāo)簽,包括:
對(duì)所述待分析問題分詞處理,得到至少一個(gè)詞組;
確定所述至少一個(gè)詞組中每個(gè)詞組與預(yù)設(shè)標(biāo)簽的共現(xiàn)頻次,并統(tǒng)計(jì)得到所述預(yù)設(shè)標(biāo)簽對(duì)應(yīng)的共現(xiàn)頻次和值,所述共現(xiàn)頻次包括詞組與所述預(yù)設(shè)標(biāo)簽出現(xiàn)在訓(xùn)練文本集合中任一個(gè)訓(xùn)練文本中的次數(shù),所述共現(xiàn)頻次和值包括所述各個(gè)詞組與預(yù)設(shè)標(biāo)簽的共現(xiàn)頻次的和值,所述預(yù)設(shè)標(biāo)簽為標(biāo)簽集合中的一個(gè)預(yù)設(shè)的標(biāo)簽;
基于所述至少一個(gè)詞組中每個(gè)詞組與所述預(yù)設(shè)標(biāo)簽的相似度,確定針對(duì)所述共現(xiàn)頻次和值的目標(biāo)加權(quán)系數(shù),并采用所述目標(biāo)加權(quán)系數(shù)對(duì)所述共現(xiàn)頻次和值進(jìn)行加權(quán)處理,得到加權(quán)共現(xiàn)頻次和值;
若所述加權(quán)共現(xiàn)頻次和值滿足預(yù)設(shè)條件,則將所述預(yù)設(shè)標(biāo)簽確定為所述待分析問題的標(biāo)簽。
3.根據(jù)權(quán)利要求2所述的方法,所述基于所述至少一個(gè)詞組中每個(gè)詞組與所述預(yù)設(shè)標(biāo)簽的相似度,確定針對(duì)所述共現(xiàn)頻次和值的目標(biāo)加權(quán)系數(shù),包括:
對(duì)所述至少一個(gè)詞組和所述預(yù)設(shè)標(biāo)簽進(jìn)行詞向量化處理,得到所述至少一個(gè)詞組中每個(gè)詞組對(duì)應(yīng)的第一詞向量和所述預(yù)設(shè)標(biāo)簽對(duì)應(yīng)的第二詞向量;
基于每個(gè)所述第一詞向量與所述第二詞向量之間的距離,確定所述每個(gè)詞組與所述預(yù)設(shè)標(biāo)簽之間的相似度;
獲取每個(gè)所述相似度對(duì)應(yīng)的加權(quán)系數(shù),得到至少一個(gè)加權(quán)系數(shù);
對(duì)所述至少一個(gè)加權(quán)系數(shù)進(jìn)行統(tǒng)計(jì)處理,得到針對(duì)所述共現(xiàn)頻次和值的目標(biāo)加權(quán)系數(shù)。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,確定所述待分析問題與所述標(biāo)準(zhǔn)問題集合中任意一個(gè)標(biāo)準(zhǔn)問題之間的語義相似度的方式包括:
獲取第一標(biāo)準(zhǔn)問題對(duì)應(yīng)的至少一個(gè)參考問題,所述第一標(biāo)準(zhǔn)問題為所述標(biāo)準(zhǔn)問題集合中的任意一個(gè)標(biāo)準(zhǔn)問題,每個(gè)所述參考問題與所述第一標(biāo)準(zhǔn)問題具有相同的語義;
調(diào)用訓(xùn)練完成的語義匹配模型將所述待分析問題與所述至少一個(gè)參考問題中各個(gè)參考問題進(jìn)行語義匹配,得到至少一個(gè)語義匹配結(jié)果,所述語義匹配結(jié)果指示匹配或不匹配;
獲取指示匹配的語義匹配結(jié)果的第一數(shù)量以及所述至少一個(gè)語義匹配結(jié)果對(duì)應(yīng)的第二數(shù)量,并基于所述第一數(shù)量與所述第二數(shù)量的比值確定所述待分析問題與所述第一標(biāo)準(zhǔn)問題之間的語義相似度。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述方法還包括:
獲取樣本文本集合,所述樣本文本集合中包含多個(gè)文本組合,每個(gè)文本組合中包括第一文本,第二文本,以及所述第一文本與所述第二文本之間的預(yù)設(shè)匹配結(jié)果;
對(duì)所述第一文本和所述第二文本進(jìn)行向量化處理,得到所述第一文本對(duì)應(yīng)的第一文本向量以及所述第二文本對(duì)應(yīng)的第二文本向量;
基于所述第一文本向量和所述第二文本向量對(duì)初始語義匹配模型進(jìn)行迭代訓(xùn)練,以更新所述初始語義匹配模型中的參數(shù);
當(dāng)檢測到參數(shù)更新后的初始語義匹配模型滿足預(yù)設(shè)條件時(shí),將所述參數(shù)更新后的初始語義匹配模型確定為訓(xùn)練完成的語義匹配模型,所述預(yù)設(shè)條件包括所述初始語義匹配模型對(duì)于所述樣本文本集合中的文本組合的匹配準(zhǔn)確率高于預(yù)設(shè)準(zhǔn)確率。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳賽安特技術(shù)服務(wù)有限公司,未經(jīng)深圳賽安特技術(shù)服務(wù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011614093.9/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 面向語義Web服務(wù)程序設(shè)計(jì)的語義數(shù)據(jù)表示和處理方法
- 一種基于語義的三維模型檢索系統(tǒng)和方法
- 一種計(jì)算機(jī)語義工程系統(tǒng)
- 導(dǎo)航方法及裝置
- 一種分層次多語義網(wǎng)系統(tǒng)及方法
- 一種基于上下文的語義匹配方法和系統(tǒng)
- 遠(yuǎn)程語義識(shí)別方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于語義依存關(guān)系的醫(yī)療文本標(biāo)注方法
- 基于多級(jí)語義表征和語義計(jì)算的信號(hào)語義識(shí)別方法
- 語義分類方法及裝置、存儲(chǔ)介質(zhì)及電子設(shè)備





