[發(fā)明專利]基于SVM分類模型的用戶查詢信息及意圖提取方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 202010600199.7 | 申請(qǐng)日: | 2020-06-29 |
| 公開(kāi)(公告)號(hào): | CN111488451B | 公開(kāi)(公告)日: | 2020-09-18 |
| 發(fā)明(設(shè)計(jì))人: | 楊貽宏 | 申請(qǐng)(專利權(quán))人: | 上海飛旗網(wǎng)絡(luò)技術(shù)股份有限公司 |
| 主分類號(hào): | G06F16/335 | 分類號(hào): | G06F16/335;G06F16/332;G06F16/35;G06K9/62 |
| 代理公司: | 成都頂峰專利事務(wù)所(普通合伙) 51224 | 代理人: | 楊俊華 |
| 地址: | 200120 上海市浦東新區(qū)自由貿(mào)*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 svm 分類 模型 用戶 查詢 信息 意圖 提取 方法 裝置 | ||
1.一種基于SVM分類模型的用戶查詢信息及意圖提取方法,其特征在于,應(yīng)用于搜索引擎,所述方法包括:
獲取終端設(shè)備發(fā)送的多個(gè)關(guān)鍵詞以及所述終端設(shè)備的設(shè)備標(biāo)識(shí);
將每個(gè)關(guān)鍵詞輸入預(yù)先訓(xùn)練完成的SVM分類模型進(jìn)行計(jì)算,得到每個(gè)關(guān)鍵詞對(duì)應(yīng)的類別分組以及所述類別分組下的多個(gè)目標(biāo)關(guān)鍵詞;
確定每個(gè)類別分組下的每個(gè)目標(biāo)關(guān)鍵詞的關(guān)鍵詞標(biāo)識(shí),根據(jù)所述關(guān)鍵詞標(biāo)識(shí)將每個(gè)類別分組進(jìn)行關(guān)聯(lián),得到多個(gè)查詢主題信息;
提取每個(gè)查詢主題信息的第一詞向量;從預(yù)設(shè)的運(yùn)行日志中確定與所述設(shè)備標(biāo)識(shí)對(duì)應(yīng)的目標(biāo)查詢記錄,并提取目標(biāo)查詢記錄的第二詞向量;
計(jì)算每個(gè)第一詞向量與所述第二詞向量之間的相似度,將最大相似度對(duì)應(yīng)的查詢主題信息確定為目標(biāo)主題信息;
基于所述目標(biāo)主題信息進(jìn)行搜索,并將搜索結(jié)果回傳給所述終端設(shè)備;
其中,從預(yù)設(shè)的運(yùn)行日志中確定與所述設(shè)備標(biāo)識(shí)對(duì)應(yīng)的目標(biāo)查詢記錄,具體包括:
獲取所述運(yùn)行日志中包括的攜帶有所述設(shè)備標(biāo)識(shí)的多個(gè)初始查詢記錄;
在預(yù)設(shè)的信息數(shù)據(jù)庫(kù)中查詢是否存在所述初始查詢記錄的反饋信息;其中,所述反饋信息在所述終端設(shè)備接收到初始查詢記錄時(shí)反饋給所述預(yù)設(shè)的信息數(shù)據(jù)庫(kù);
若存在所述反饋信息,將所述反饋信息對(duì)應(yīng)的初始查詢記錄確定為所述設(shè)備標(biāo)識(shí)對(duì)應(yīng)的目標(biāo)查詢記錄。
2.如權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
計(jì)算所述目標(biāo)主題信息和預(yù)設(shè)主題信息之間的詞向量相似度;
判斷所述詞向量相似度是否超過(guò)設(shè)定閾值;
若所述詞向量相似度超過(guò)所述設(shè)定閾值,則向所述終端設(shè)備發(fā)送提示信息,以提示所述終端設(shè)備基于所述提示信息與目標(biāo)設(shè)備進(jìn)行通訊。
3.如權(quán)利要求1或2所述的方法,其特征在于,確定每個(gè)類別分組下的每個(gè)目標(biāo)關(guān)鍵詞的關(guān)鍵詞標(biāo)識(shí),根據(jù)所述關(guān)鍵詞標(biāo)識(shí)將每個(gè)類別分組進(jìn)行關(guān)聯(lián),得到多個(gè)查詢主題信息,包括:
確定每個(gè)目標(biāo)關(guān)鍵詞的詞性信息以及所述詞性信息對(duì)應(yīng)的上游詞性信息和下游詞性信息;
在每個(gè)類別分組下查找與每個(gè)目標(biāo)關(guān)鍵詞相對(duì)應(yīng)的上游詞性信息對(duì)應(yīng)的上游關(guān)鍵詞以及與每個(gè)目標(biāo)關(guān)鍵詞相對(duì)應(yīng)的下游詞性信息對(duì)應(yīng)下游關(guān)鍵詞;
將每個(gè)目標(biāo)關(guān)鍵詞及其對(duì)應(yīng)的上游關(guān)鍵詞和下游關(guān)鍵詞進(jìn)行關(guān)聯(lián)得到所述查詢主題信息。
4.如權(quán)利要求1所述的方法,其特征在于,計(jì)算每個(gè)第一詞向量與所述第二詞向量之間的相似度,將最大相似度對(duì)應(yīng)的查詢主題信息確定為目標(biāo)主題信息,包括:
針對(duì)每個(gè)第一詞向量,計(jì)算該第一詞向量與每個(gè)目標(biāo)查詢記錄對(duì)應(yīng)的第二詞向量之間的相似度,并計(jì)算該第一詞向量對(duì)應(yīng)的多個(gè)相似度的平均值;
將計(jì)算得到的最大平均值對(duì)應(yīng)的第一詞向量的查詢主題信息確定為目標(biāo)主題信息。
5.一種基于SVM分類模型的用戶查詢信息及意圖提取裝置,其特征在于,應(yīng)用于搜索引擎,所述裝置包括:
信息獲取模塊,用于獲取終端設(shè)備發(fā)送的多個(gè)關(guān)鍵詞以及所述終端設(shè)備的設(shè)備標(biāo)識(shí);
分類計(jì)算模塊,用于將每個(gè)關(guān)鍵詞輸入預(yù)先訓(xùn)練完成的SVM分類模型進(jìn)行計(jì)算,得到每個(gè)關(guān)鍵詞對(duì)應(yīng)的類別分組以及所述類別分組下的多個(gè)目標(biāo)關(guān)鍵詞;
主題獲得模塊,用于確定每個(gè)類別分組下的每個(gè)目標(biāo)關(guān)鍵詞的關(guān)鍵詞標(biāo)識(shí),根據(jù)所述關(guān)鍵詞標(biāo)識(shí)將每個(gè)類別分組進(jìn)行關(guān)聯(lián),得到多個(gè)查詢主題信息;
向量提取模塊,用于提取每個(gè)查詢主題信息的第一詞向量;從預(yù)設(shè)的運(yùn)行日志中確定與所述設(shè)備標(biāo)識(shí)對(duì)應(yīng)的目標(biāo)查詢記錄,并提取目標(biāo)查詢記錄的第二詞向量;
主題確定模塊,用于計(jì)算每個(gè)第一詞向量與所述第二詞向量之間的相似度,將最大相似度對(duì)應(yīng)的查詢主題信息確定為目標(biāo)主題信息;
信息搜索模塊,用于基于所述目標(biāo)主題信息進(jìn)行搜索,并將搜索結(jié)果回傳給所述終端設(shè)備;
其中,所述向量提取模塊,具體用于:
獲取所述運(yùn)行日志中包括的攜帶有所述設(shè)備標(biāo)識(shí)的多個(gè)初始查詢記錄;
在預(yù)設(shè)的信息數(shù)據(jù)庫(kù)中查詢是否存在所述初始查詢記錄的反饋信息;其中,所述反饋信息在所述終端設(shè)備接收到初始查詢記錄時(shí)反饋給所述預(yù)設(shè)的信息數(shù)據(jù)庫(kù);
若存在所述反饋信息,將所述反饋信息對(duì)應(yīng)的初始查詢記錄確定為所述設(shè)備標(biāo)識(shí)對(duì)應(yīng)的目標(biāo)查詢記錄。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海飛旗網(wǎng)絡(luò)技術(shù)股份有限公司,未經(jīng)上海飛旗網(wǎng)絡(luò)技術(shù)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010600199.7/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 基于支持向量機(jī)的入侵檢測(cè)方法
- 一種提高SVM建模準(zhǔn)確率的方法
- 一種用于解決多分類問(wèn)題的糾錯(cuò)SVM分類方法
- 基于SVM分類器的隱私保護(hù)和數(shù)據(jù)安全訪問(wèn)的方法
- 基于SVM算法的客戶用電需求識(shí)別方法
- 基于V-SVM的DDoS攻擊檢測(cè)方法和裝置
- 一種改進(jìn)最小二乘支持向量機(jī)的諧波發(fā)射水平評(píng)估方法
- 基于SVM模型的GNSS觀測(cè)數(shù)據(jù)質(zhì)量控制及定位方法
- 用于自動(dòng)選擇安全虛擬機(jī)的系統(tǒng)和方法
- 一種基于BAS-SVM的配電網(wǎng)電壓暫降源識(shí)別方法





