[發(fā)明專利]數(shù)據(jù)泛化方法、裝置、設(shè)備和介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 201910015940.0 | 申請(qǐng)日: | 2019-01-08 |
| 公開(kāi)(公告)號(hào): | CN109740161B | 公開(kāi)(公告)日: | 2023-06-20 |
| 發(fā)明(設(shè)計(jì))人: | 周環(huán)宇;馮欣偉;余淼 | 申請(qǐng)(專利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號(hào): | G06F40/30 | 分類號(hào): | G06F40/30;G06F40/247 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100085 北京市*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)據(jù) 泛化 方法 裝置 設(shè)備 介質(zhì) | ||
本發(fā)明實(shí)施例公開(kāi)了一種數(shù)據(jù)泛化方法、裝置、設(shè)備和介質(zhì),涉及數(shù)據(jù)處理技術(shù)領(lǐng)域。該方法包括:根據(jù)各檢索項(xiàng)中的詞語(yǔ),對(duì)包括待泛化的目標(biāo)檢索項(xiàng)和歷史檢索項(xiàng)的檢索項(xiàng)集進(jìn)行分組;根據(jù)分組結(jié)果,從歷史檢索項(xiàng)中確定所述目標(biāo)檢索項(xiàng)的泛化檢索項(xiàng)。本發(fā)明實(shí)施例提供了一種數(shù)據(jù)泛化方法、裝置、設(shè)備和介質(zhì),實(shí)現(xiàn)了對(duì)待泛化的檢索項(xiàng)進(jìn)行合理和廣泛的泛化。
技術(shù)領(lǐng)域
本發(fā)明實(shí)施例涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種數(shù)據(jù)泛化方法、裝置、設(shè)備和介質(zhì)。
背景技術(shù)
表述同一語(yǔ)義的檢索項(xiàng)(query)往往具有不止一種表述形式,如何盡可能多的挖掘這些表述形式就是對(duì)query的泛化。
當(dāng)前對(duì)query的泛化主要是基于同義詞進(jìn)行關(guān)鍵詞的替換。
然而,盡管使用關(guān)鍵詞替換能夠解決一部分的泛化,但是這些泛化還不夠全面。畢竟關(guān)鍵詞替換可以解決的問(wèn)題的是有限的,但是人總可能想出一些意想不到的提問(wèn)方式。
此外,關(guān)鍵詞替換在特定主語(yǔ)情況下也可能出現(xiàn)錯(cuò)誤。比如在絕大多數(shù)情況下“誰(shuí)”和“哪個(gè)人”是等義的。但是比如對(duì)于“2018足球世界杯冠軍是誰(shuí)”,泛化為“2018足球世界杯冠軍是哪個(gè)人”顯然是不合適的。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種數(shù)據(jù)泛化方法、裝置、設(shè)備和介質(zhì),以實(shí)現(xiàn)對(duì)待泛化的檢索項(xiàng)進(jìn)行合理和廣泛的泛化。
第一方面,本發(fā)明實(shí)施例提供了一種數(shù)據(jù)泛化方法,該方法包括:
根據(jù)各檢索項(xiàng)中的詞語(yǔ),對(duì)包括待泛化的目標(biāo)檢索項(xiàng)和歷史檢索項(xiàng)的檢索項(xiàng)集進(jìn)行分組;
根據(jù)分組結(jié)果,從歷史檢索項(xiàng)中確定所述目標(biāo)檢索項(xiàng)的泛化檢索項(xiàng)。
第二方面,本發(fā)明實(shí)施例還提供了一種數(shù)據(jù)泛化裝置,該裝置包括:
分組模塊,用于根據(jù)各檢索項(xiàng)中的詞語(yǔ),對(duì)包括待泛化的目標(biāo)檢索項(xiàng)和歷史檢索項(xiàng)的檢索項(xiàng)集進(jìn)行分組;
泛化模塊,用于根據(jù)分組結(jié)果,從歷史檢索項(xiàng)中確定所述目標(biāo)檢索項(xiàng)的泛化檢索項(xiàng)。
第三方面,本發(fā)明實(shí)施例還提供了一種設(shè)備,所述設(shè)備包括:
一個(gè)或多個(gè)處理器;
存儲(chǔ)裝置,用于存儲(chǔ)一個(gè)或多個(gè)程序,
當(dāng)所述一個(gè)或多個(gè)程序被所述一個(gè)或多個(gè)處理器執(zhí)行,使得所述一個(gè)或多個(gè)處理器實(shí)現(xiàn)如本發(fā)明實(shí)施例中任一所述的數(shù)據(jù)泛化方法。
第四方面,本發(fā)明實(shí)施例還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如本發(fā)明實(shí)施例中任一所述的數(shù)據(jù)泛化方法。
本發(fā)明實(shí)施例通過(guò)根據(jù)各檢索項(xiàng)中的詞語(yǔ),對(duì)包括待泛化的目標(biāo)檢索項(xiàng)和歷史檢索項(xiàng)的檢索項(xiàng)集進(jìn)行分組,從而實(shí)現(xiàn)對(duì)目標(biāo)檢索項(xiàng)的廣泛泛化。通過(guò)根據(jù)分組結(jié)果,從歷史檢索項(xiàng)中確定所述目標(biāo)檢索項(xiàng)的泛化檢索項(xiàng),從而使得泛化檢索項(xiàng)符合用戶提問(wèn)邏輯,避免直接替換導(dǎo)致泛化的檢索項(xiàng)不合理的情況。
附圖說(shuō)明
圖1為本發(fā)明實(shí)施例一提供的一種數(shù)據(jù)泛化方法的流程圖;
圖2是本發(fā)明實(shí)施例二提供的一種數(shù)據(jù)泛化方法的流程圖;
圖3是本發(fā)明實(shí)施例三提供的一種數(shù)據(jù)泛化方法的流程圖;
圖4是本發(fā)明實(shí)施例四提供的一種數(shù)據(jù)泛化方法的流程圖;
圖5是本發(fā)明實(shí)施例四提供的一種數(shù)據(jù)泛化方法的另一種流程描述示意圖;
圖6是本發(fā)明實(shí)施例五提供的一種數(shù)據(jù)泛化裝置的結(jié)構(gòu)示意圖;
圖7為本發(fā)明實(shí)施例六提供的一種設(shè)備的結(jié)構(gòu)示意圖。
具體實(shí)施方式
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910015940.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





