[發(fā)明專利]數(shù)據(jù)處理方法及裝置、存儲介質(zhì)、電子設(shè)備在審
| 申請?zhí)枺?/td> | 202110906879.6 | 申請日: | 2021-08-09 |
| 公開(公告)號: | CN113627161A | 公開(公告)日: | 2021-11-09 |
| 發(fā)明(設(shè)計(jì))人: | 王煒;姚瀾;孫翠榮;解忠乾;羅川江 | 申請(專利權(quán))人: | 杭州網(wǎng)易云音樂科技有限公司 |
| 主分類號: | G06F40/253 | 分類號: | G06F40/253;G06F40/284;G06F40/289;G06K9/62;G06N3/04;G06F16/953 |
| 代理公司: | 北京律智知識產(chǎn)權(quán)代理有限公司 11438 | 代理人: | 王輝;闞梓瑄 |
| 地址: | 310052 浙江省杭州市蕭山區(qū)錢江世*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)據(jù)處理 方法 裝置 存儲 介質(zhì) 電子設(shè)備 | ||
本公開的實(shí)施方式涉及計(jì)算機(jī)技術(shù)領(lǐng)域,更具體地,本公開的實(shí)施方式涉及數(shù)據(jù)處理方法及裝置,存儲介質(zhì)和電子設(shè)備。所述方法包括:獲取搜索文本;基于所述搜索文本確定對應(yīng)的第一意圖評分結(jié)果;其中,所述第一意圖評分結(jié)果以離線方式獲取;以及根據(jù)所述搜索文本對應(yīng)的語法向量的編碼特征和詞向量的編碼特征進(jìn)行聚合處理,以根據(jù)聚合處理結(jié)果確定第二意圖評分結(jié)果;結(jié)合所述第一意圖評分結(jié)果和所述第二意圖評分結(jié)果確定所述搜索文本的泛搜意圖識別結(jié)果。本公開的方案在保證意圖識別結(jié)果準(zhǔn)確性的前提下,可以進(jìn)一步的保證意圖識別的效率,提升針對搜索文本的意圖識別的速度。
技術(shù)領(lǐng)域
本公開的實(shí)施方式涉及計(jì)算機(jī)技術(shù)領(lǐng)域,更具體地,本公開的實(shí)施方式涉及數(shù)據(jù)處理方法及裝置,存儲介質(zhì)和電子設(shè)備。
背景技術(shù)
本部分旨在為權(quán)利要求中陳述的本公開的實(shí)施方式提供背景或上下文,此處的描述不因?yàn)榘ㄔ诒静糠种芯统姓J(rèn)是現(xiàn)有技術(shù)。
在目前的技術(shù)中,用戶可以通過在搜索引擎中輸入搜索請求來得到期望得到的數(shù)據(jù)內(nèi)容。在音樂搜索場景中,用戶可以在搜索框中輸入搜索請求,例如文字內(nèi)容;音樂搜索引擎可以根據(jù)用戶輸入的文字進(jìn)行搜索并提供相應(yīng)的搜索結(jié)果。音樂搜索引擎或者后臺服務(wù)器在根據(jù)用戶輸入的內(nèi)容進(jìn)行數(shù)據(jù)搜索時(shí),可以根據(jù)意圖識別來判斷用戶輸入的文字是否屬于泛搜索意圖。
發(fā)明內(nèi)容
但是,在一些技術(shù)中,對于用戶輸入的搜索請求,意圖識別通常只能給出精準(zhǔn)的搜索請求意圖的識別結(jié)果。對于并不明確的搜索請求,搜索引擎根據(jù)意圖識別結(jié)果做召回排序,對于這類泛意圖搜索并不能提供準(zhǔn)確的搜索結(jié)果。
為此,非常需要一種改進(jìn)的數(shù)據(jù)處理方法及裝置、存儲介質(zhì)和電子設(shè)備,以提供一種能夠?yàn)闇?zhǔn)確識別用戶的搜索請求是否為泛搜意圖的方案。
在本上下文中,本發(fā)明的實(shí)施方式期望提供一種數(shù)據(jù)處理方法和裝置、存儲介質(zhì)和電子設(shè)備。
根據(jù)本公開的一個(gè)方面,提供一種數(shù)據(jù)處理方法,包括:獲取搜索文本;
基于所述搜索文本確定對應(yīng)的第一意圖評分結(jié)果;其中,所述第一意圖評分結(jié)果以離線方式獲取;以及
根據(jù)所述搜索文本對應(yīng)的語法向量的編碼特征和詞向量的編碼特征進(jìn)行聚合處理,以根據(jù)聚合處理結(jié)果確定第二意圖評分結(jié)果;
結(jié)合所述第一意圖評分結(jié)果和所述第二意圖評分結(jié)果確定所述搜索文本的泛搜意圖識別結(jié)果。
在本公開的一種示例性實(shí)施例中,所述方法還包括:
基于預(yù)先構(gòu)建的實(shí)體詞典確定所述搜索文本對應(yīng)的熱度信息及意圖信息,并根據(jù)所述熱度信息和意圖信息確定第三意圖識別結(jié)果;以用于結(jié)合所述第一意圖評分結(jié)果、所述第二意圖評分結(jié)果和所述第三意圖識別結(jié)果確定所述搜索文本的泛搜意圖識別結(jié)果。
在本公開的一種示例性實(shí)施例中,基于所述搜索文本確定對應(yīng)的第一意圖評分結(jié)果,包括:
基于所述搜索文本查詢所述搜索文本歷史數(shù)據(jù)以獲取相匹配的歷史搜索文本,并將所述歷史搜索文本對應(yīng)的第一意圖評分結(jié)果配置為當(dāng)前的所述搜索文本對應(yīng)的第一意圖評分結(jié)果。
在本公開的一種示例性實(shí)施例中,所述基于所述搜索文本對應(yīng)的語法向量和詞向量對應(yīng)的編碼特征進(jìn)行聚合處理,以根據(jù)聚合處理結(jié)果確定第二意圖評分結(jié)果,包括:
對所述搜索文本進(jìn)行第二預(yù)處理;
對第二預(yù)處理結(jié)果進(jìn)行切詞處理,利用預(yù)設(shè)的單字詞典為各切詞結(jié)果配置對應(yīng)的標(biāo)識,并利用各切詞結(jié)果對應(yīng)的映射值構(gòu)建所述詞向量;以及
按預(yù)設(shè)粒度對所述第二預(yù)處理結(jié)果進(jìn)行拆分,利用預(yù)設(shè)的語法詞典配置各拆分結(jié)果對應(yīng)的標(biāo)識,并利用拆分結(jié)果對對應(yīng)的映射值構(gòu)建所述語法向量;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州網(wǎng)易云音樂科技有限公司,未經(jīng)杭州網(wǎng)易云音樂科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110906879.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)處理設(shè)備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設(shè)備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計(jì)算機(jī)可讀取的記錄介質(zhì)
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序





