[發(fā)明專利]關(guān)鍵詞生成方法、裝置、設(shè)備及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202110036768.4 | 申請日: | 2021-01-12 |
| 公開(公告)號: | CN112364136B | 公開(公告)日: | 2021-04-23 |
| 發(fā)明(設(shè)計)人: | 鄒若奇 | 申請(專利權(quán))人: | 平安國際智慧城市科技股份有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06N3/04 |
| 代理公司: | 廣州三環(huán)專利商標代理有限公司 44202 | 代理人: | 熊永強 |
| 地址: | 518000 廣東省深圳市前海深港合*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 關(guān)鍵詞 生成 方法 裝置 設(shè)備 存儲 介質(zhì) | ||
本申請?zhí)峁┝艘环N關(guān)鍵詞生成方法,包括:獲取目標文本對應(yīng)的詞向量矩陣;將目標文本對應(yīng)的詞向量矩陣輸入至神經(jīng)網(wǎng)絡(luò)模型,得到目標文本中每個詞對應(yīng)的得分,得分包括拼音維度的得分、詞性維度的得分以及單詞維度的得分;根據(jù)目標文本中每個詞對應(yīng)的得分,確定目標文本的搜索關(guān)鍵詞。本申請實施例基于注意力機制的Bi?LSTM網(wǎng)絡(luò),提取目標文本更深層次、更豐富的特征信息,同時結(jié)合拼音、詞性、單詞三個維度的得分,進一步得到更多尺度的信息特征,進而提高了目標文本關(guān)鍵詞生成的準確率。
技術(shù)領(lǐng)域
本申請涉及計算機技術(shù)領(lǐng)域,尤其涉及一種關(guān)鍵詞生成方法、裝置、設(shè)備及存儲介質(zhì)。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,人們在生活、學(xué)習(xí)和工作中越來越依賴于互聯(lián)網(wǎng),例如通過互聯(lián)網(wǎng)查找需要的視頻或者文本資料。人們在查找資料時,只需在搜索引擎中輸入需要查找的資料的關(guān)鍵詞,即可得到需要的信息。但是,搜索引擎在根據(jù)用戶輸入的關(guān)鍵詞進行查找時,主要是將用戶輸入的關(guān)鍵詞與每個資料對應(yīng)的關(guān)鍵詞進行匹配,將匹配度高的資料呈現(xiàn)給用戶。因此,搜索引擎查找到的資料與用戶需要的資料的匹配程度依賴于資料對應(yīng)的關(guān)鍵詞,如果資料對應(yīng)的關(guān)鍵詞不能準確的表示該資料的主要內(nèi)容,則搜索引擎的搜索到的資料不能很好的滿足用戶的需求。
發(fā)明內(nèi)容
本申請?zhí)峁┝艘环N關(guān)鍵詞生成方法、裝置、設(shè)備及存儲介質(zhì),能夠提高目標文本關(guān)鍵詞生成的準確率。
第一方面,本申請實施例提供了一種關(guān)鍵詞生成方法,包括:獲取目標文本對應(yīng)的詞向量矩陣;將目標文本對應(yīng)的詞向量矩陣輸入至神經(jīng)網(wǎng)絡(luò)模型,得到目標文本中每個詞對應(yīng)的得分,得分包括拼音維度的得分、詞性維度的得分以及單詞維度的得分;根據(jù)目標文本中每個詞對應(yīng)的得分,確定目標文本的搜索關(guān)鍵詞。
在一種可能的實現(xiàn)方式中,根據(jù)目標文本中每個詞對應(yīng)的得分,確定目標文本的搜索關(guān)鍵詞,包括:對拼音維度的得分、詞性維度的得分以及單詞維度的得分進行加權(quán)求和,得到目標文本中的每個詞對應(yīng)的最終得分;將目標文本中的每個詞根據(jù)最終得分從大到小進行排序,將排列在前的預(yù)設(shè)數(shù)量的詞作為目標文本的搜索關(guān)鍵詞。
在一種可能的實現(xiàn)方式中,獲取目標文本對應(yīng)的詞向量矩陣之前,還包括:獲取目標文本,對目標文本進行分詞處理,得到目標文本對應(yīng)的多個詞;對目標文本對應(yīng)的多個詞采用詞向量模型進行處理,得到目標文本對應(yīng)的詞向量矩陣。
在一種可能的實現(xiàn)方式中,獲取目標文本對應(yīng)的詞向量矩陣之前,還包括:獲取訓(xùn)練文本對應(yīng)的詞向量矩陣;將訓(xùn)練文本的詞向量矩陣輸入至基于注意力機制的雙向長短期記憶人工神經(jīng)網(wǎng)絡(luò)模型,得到訓(xùn)練文本對應(yīng)的文本表示矩陣;文本表示矩陣與拼音維度的實際得分訓(xùn)練第一線性回歸模型,得到訓(xùn)練文本對應(yīng)的拼音維度的預(yù)測得分,根據(jù)拼音維度的預(yù)測得分與拼音維度的實際得分,確定第一損失函數(shù)值;根據(jù)第一損失函數(shù)值更新第一線性回歸模型的拼音維度的權(quán)重矩陣和第一線性回歸模型的拼音維度的偏置矩陣,得到訓(xùn)練好的第一線性回歸模型;文本表示矩陣與詞性維度的實際得分訓(xùn)練第二線性回歸模型,得到訓(xùn)練文本對應(yīng)的詞性維度的預(yù)測得分,根據(jù)詞性維度的預(yù)測得分與詞性維度的實際得分,確定第二損失函數(shù)值;根據(jù)第二損失函數(shù)值更新第二線性回歸模型的詞性維度的權(quán)重矩陣和第二線性回歸模型的詞性維度的偏置矩陣,得到訓(xùn)練好的第二線性回歸模型;文本表示矩陣與單詞維度的實際得分訓(xùn)練第三線性回歸模型,得到訓(xùn)練文本對應(yīng)的單詞維度的預(yù)測得分,根據(jù)單詞維度的預(yù)測得分與單詞維度的實際得分,確定第三損失函數(shù)值;根據(jù)第三損失函數(shù)值更新第三線性回歸模型的單詞維度的權(quán)重矩陣和第三線性回歸模型的單詞維度的偏置矩陣,得到訓(xùn)練好的第三線性回歸模型。
在一種可能的實現(xiàn)方式中,上述將目標文本對應(yīng)的詞向量矩陣輸入至神經(jīng)網(wǎng)絡(luò)模型,得到目標文本中每個詞對應(yīng)的得分,包括:將目標文本對應(yīng)的詞向量矩陣輸入至基于注意力機制的雙向長短期記憶人工神經(jīng)網(wǎng)絡(luò)模型,得到目標文本對應(yīng)的文本表示矩陣;根據(jù)訓(xùn)練好的第一線性回歸模型中的拼音維度的權(quán)重矩陣、拼音維度的偏置矩陣以及文本表示矩陣,確定所述目標文本中每個詞對應(yīng)的拼音維度的得分。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安國際智慧城市科技股份有限公司,未經(jīng)平安國際智慧城市科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110036768.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 關(guān)鍵詞輸出設(shè)備和關(guān)鍵詞輸出方法
- 用于選擇用于網(wǎng)絡(luò)發(fā)布的關(guān)鍵詞的方法和設(shè)備
- 關(guān)鍵詞質(zhì)量度的檢測方法和裝置
- 關(guān)鍵詞排名的檢測方法和裝置
- 關(guān)鍵詞相似度獲取方法、裝置及服務(wù)器
- 關(guān)鍵詞推薦方法及裝置
- 一種關(guān)鍵詞檢索管理系統(tǒng)
- 一種信息推薦方法、電子設(shè)備、存儲介質(zhì)及系統(tǒng)
- 關(guān)鍵詞廣告投放自動化否定關(guān)鍵詞方法及裝置
- 一種長尾關(guān)鍵詞識別方法、關(guān)鍵詞搜索方法及計算機設(shè)備





