[發(fā)明專利]基于對同類數(shù)據(jù)對象整合的數(shù)據(jù)搜索的方法和裝置有效
| 申請?zhí)枺?/td> | 201310182427.3 | 申請日: | 2013-05-16 |
| 公開(公告)號: | CN104166651B | 公開(公告)日: | 2017-10-13 |
| 發(fā)明(設(shè)計)人: | 郎皓;歐海峰;張丙奇;孫健 | 申請(專利權(quán))人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京國昊天誠知識產(chǎn)權(quán)代理有限公司11315 | 代理人: | 許志勇 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 同類 數(shù)據(jù) 對象 整合 搜索 方法 裝置 | ||
1.一種基于對同類數(shù)據(jù)對象整合的數(shù)據(jù)搜索的方法,其特征在于,包括:
接收來自用戶的搜索請求,在所有待搜索的數(shù)據(jù)對象中搜索與所述搜索請求相匹配的一個或多個數(shù)據(jù)對象;
分析搜索到的所述一個或多個數(shù)據(jù)對象中的每一個,以獲取每一個所述數(shù)據(jù)對象的數(shù)據(jù)標(biāo)簽;
對獲取的所述數(shù)據(jù)標(biāo)簽與待搜索的數(shù)據(jù)對象進行匹配,以獲得與所述數(shù)據(jù)標(biāo)簽相匹配的一個或多個同類的數(shù)據(jù)對象;
將所述數(shù)據(jù)標(biāo)簽相匹配的一個或多個數(shù)據(jù)對象整合為同類數(shù)據(jù)對象組合,并作為搜索結(jié)果返回至用戶。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述數(shù)據(jù)標(biāo)簽包括第一數(shù)據(jù)標(biāo)簽和第二數(shù)據(jù)標(biāo)簽,第一數(shù)據(jù)標(biāo)簽和第二數(shù)據(jù)標(biāo)簽分別標(biāo)識數(shù)據(jù)對象不同的屬性特征。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,還包括:對所有待搜索的數(shù)據(jù)對象,預(yù)先整合處理,以確定每一個所述待搜索的數(shù)據(jù)對象相對應(yīng)的一個或多個同類數(shù)據(jù)對象,以得到數(shù)據(jù)對象映射關(guān)系表。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,對所有待搜索的數(shù)據(jù)對象,預(yù)先整合處理,包括:
對各數(shù)據(jù)對象中的第二數(shù)據(jù)標(biāo)簽以及第二數(shù)據(jù)標(biāo)簽類目分布表進行挖掘處理;
對各數(shù)據(jù)對象中的第二數(shù)據(jù)標(biāo)簽進行第二數(shù)據(jù)標(biāo)簽挖掘,生成所有數(shù)據(jù)對象的第二數(shù)據(jù)標(biāo)簽同義詞的集合;
對各數(shù)據(jù)對象中的第一數(shù)據(jù)標(biāo)簽進行第一數(shù)據(jù)標(biāo)簽挖掘,生成所有數(shù)據(jù)對象的第一數(shù)據(jù)標(biāo)簽同義詞集合;
對各數(shù)據(jù)對象中的第一數(shù)據(jù)標(biāo)簽和第二數(shù)據(jù)標(biāo)簽進行挖掘,生成第一數(shù)據(jù)標(biāo)簽至第二數(shù)據(jù)標(biāo)簽的映射關(guān)系。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,
所述第二數(shù)據(jù)標(biāo)簽同義詞包括:相同類目下,具有不同第二數(shù)據(jù)標(biāo)簽且具有相同第一數(shù)據(jù)標(biāo)簽的多個數(shù)據(jù)對象;
所述第一數(shù)據(jù)標(biāo)簽同義詞包括:同一數(shù)據(jù)對象中的多個相似的第一數(shù)據(jù)標(biāo)簽。
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,對各數(shù)據(jù)對象中的第一數(shù)據(jù)標(biāo)簽和第二數(shù)據(jù)標(biāo)簽進行挖掘,生成第一數(shù)據(jù)標(biāo)簽至第二數(shù)據(jù)標(biāo)簽的映射關(guān)系,包括:如果一數(shù)據(jù)對象僅有一個第一數(shù)據(jù)標(biāo)簽且所述第一數(shù)據(jù)標(biāo)簽僅與唯一的第二數(shù)據(jù)標(biāo)簽存在共現(xiàn),則建立所述第一數(shù)據(jù)標(biāo)簽與所述第二數(shù)據(jù)標(biāo)簽的映射關(guān)系。
7.根據(jù)權(quán)利要求3所述的方法,其特征在于,對所有待搜索的數(shù)據(jù)對象,預(yù)先整合處理,包括:
抽取同一數(shù)據(jù)對象中的一個或多個第二數(shù)據(jù)標(biāo)簽,以得到一個或多個候選第二數(shù)據(jù)標(biāo)簽,并對抽取的一個或多個候選第二數(shù)據(jù)標(biāo)簽進行消歧;
基于配置的規(guī)則,抽取多個數(shù)據(jù)對象中的第一數(shù)據(jù)標(biāo)簽,并對抽取的多個第一數(shù)據(jù)標(biāo)簽歸一化處理;
將互為同義詞的第二數(shù)據(jù)標(biāo)簽或第一數(shù)據(jù)標(biāo)簽進行歸一化;
根據(jù)構(gòu)建的第一數(shù)據(jù)標(biāo)簽與第二數(shù)據(jù)標(biāo)簽的映射關(guān)系,對缺少第二數(shù)據(jù)標(biāo)簽的數(shù)據(jù)對象,進行第二數(shù)據(jù)標(biāo)簽補全。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,對抽取的一個或多個候選第二數(shù)據(jù)標(biāo)簽進行消歧,包括:
基于第二數(shù)據(jù)標(biāo)簽的類目分布表,獲取所述候選第二數(shù)據(jù)標(biāo)簽在所述類目中出現(xiàn)的次數(shù),若次數(shù)大于預(yù)設(shè)的閾值,則認為是所述數(shù)據(jù)對象的第二數(shù)據(jù)標(biāo)簽;和/或,若一數(shù)據(jù)對象出現(xiàn)多個候選第二數(shù)據(jù)標(biāo)簽,則選擇在第二數(shù)據(jù)標(biāo)簽類目分布表中,出現(xiàn)次數(shù)最多的一個所述第二數(shù)據(jù)標(biāo)簽作為所述數(shù)據(jù)對象的第二數(shù)據(jù)標(biāo)簽。
9.如權(quán)利要求1所述的方法,其特征在于,包括:
在搜索結(jié)果頁中,展示所述同類數(shù)據(jù)組合中的多個數(shù)據(jù)對象的其中一個,其中,所述同類數(shù)據(jù)組合包括:互為同類數(shù)據(jù)對象的多個數(shù)據(jù)對象。
10.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述同類數(shù)據(jù)對象包括:在相同類目下,具有相同或同義的第二數(shù)據(jù)標(biāo)簽并且具有相同或同義的第一數(shù)據(jù)標(biāo)簽的多個數(shù)據(jù)對象。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團控股有限公司,未經(jīng)阿里巴巴集團控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310182427.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





