[發(fā)明專利]一種搜索方法和處理設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 201710936315.0 | 申請(qǐng)日: | 2017-10-10 |
| 公開(公告)號(hào): | CN110069650A | 公開(公告)日: | 2019-07-30 |
| 發(fā)明(設(shè)計(jì))人: | 劉瑞濤;劉宇;徐良鵬 | 申請(qǐng)(專利權(quán))人: | 阿里巴巴集團(tuán)控股有限公司 |
| 主分類號(hào): | G06F16/583 | 分類號(hào): | G06F16/583;G06F16/58;G06F16/51;G06F16/33;G06Q30/06 |
| 代理公司: | 北京三友知識(shí)產(chǎn)權(quán)代理有限公司 11127 | 代理人: | 李輝;徐煥 |
| 地址: | 英屬開曼*** | 國省代碼: | 開曼群島;KY |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖像特征向量 文本特征向量 處理設(shè)備 目標(biāo)圖像 文本 搜索 提取目標(biāo)圖像 系統(tǒng)處理能力 語義 技術(shù)效果 圖像內(nèi)容 文本方式 向量空間 相關(guān)度 圖像 申請(qǐng) | ||
1.一種搜索方法,其特征在于,所述方法包括:
提取目標(biāo)圖像的圖像特征向量,其中,所述圖像特征向量用于表征所述目標(biāo)圖像的圖像內(nèi)容;
在同一向量空間中,根據(jù)所述圖像特征向量與文本的文本特征向量之間的相關(guān)度,確定所述目標(biāo)圖像對(duì)應(yīng)的文本,其中,所述文本特征向量用于表征文本的語義。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在根據(jù)所述圖像特征向量與文本的文本特征向量之間的相關(guān)度,確定所述目標(biāo)圖像對(duì)應(yīng)的文本之前,還包括:
根據(jù)所述圖像特征向量與所述文本特征向量之間的歐式距離,確定所述目標(biāo)圖像與文本之間的相關(guān)度。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述圖像特征向量與文本的文本特征向量之間的相關(guān)度,確定所述目標(biāo)圖像對(duì)應(yīng)的文本,包括:
將文本特征向量與所述目標(biāo)圖像的圖像特征向量之間的相關(guān)度大于預(yù)設(shè)閾值的一個(gè)或多個(gè)文本作為所述目標(biāo)圖像對(duì)應(yīng)的文本;
或者,將文本特征向量與所述目標(biāo)圖像的圖像特征向量之間的相關(guān)度位于前預(yù)設(shè)數(shù)量的文本作為所述目標(biāo)圖像的文本。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述圖像特征向量與文本的文本特征向量之間的相關(guān)度,確定所述目標(biāo)圖像對(duì)應(yīng)的文本,包括:
逐個(gè)確定所述圖像特征向量與多個(gè)文本中各個(gè)文本的文本特征向量之間的相關(guān)度;
在確定出所述圖像特征向量與多個(gè)文本中各個(gè)文本的文本特征向量之間的相似度后,基于確定出的所述圖像特征向量與多個(gè)文本中各個(gè)文本的文本特征向量之間的相似度,確定所述目標(biāo)圖像對(duì)應(yīng)的文本。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,在提取目標(biāo)圖像的圖像特征向量之前,還包括:
獲取搜索點(diǎn)擊行為數(shù)據(jù),其中,所述搜索點(diǎn)擊行為數(shù)據(jù)包括:搜索文本和基于搜索文本點(diǎn)擊的圖像數(shù)據(jù);
將所述搜索點(diǎn)擊行為數(shù)據(jù)轉(zhuǎn)換為多個(gè)圖像文本對(duì);
根據(jù)所述多個(gè)圖像文本對(duì),訓(xùn)練得到用于提取圖像特征向量和文本特征向量的數(shù)據(jù)模型。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,將所述搜索點(diǎn)擊行為數(shù)據(jù)轉(zhuǎn)換為多個(gè)圖像文本對(duì)包括:
對(duì)所述搜索文本進(jìn)行分詞處理和詞性分析;
從分詞處理和詞性分析所得到的數(shù)據(jù)中確定出文本;
對(duì)所述基于搜索文本點(diǎn)擊的圖像數(shù)據(jù)進(jìn)行去重處理;
根據(jù)確定出的文本和去重處理后得到的圖像數(shù)據(jù),建立圖像文本對(duì)。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述圖像文本對(duì)包括單標(biāo)簽對(duì),所述單標(biāo)簽對(duì)中攜帶有:一個(gè)圖像和一個(gè)文本。
8.一種處理設(shè)備,包括處理器以及用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器,所述處理器執(zhí)行所述指令時(shí)實(shí)現(xiàn):
確定圖像文本的方法,其特征在于,所述方法包括:
提取目標(biāo)圖像的圖像特征向量,其中,所述圖像特征向量用于表征所述目標(biāo)圖像的圖像內(nèi)容;
在同一向量空間中,根據(jù)所述圖像特征向量與文本的文本特征向量之間的相關(guān)度,確定所述目標(biāo)圖像對(duì)應(yīng)的文本,其中,所述文本特征向量用于表征文本的語義。
9.根據(jù)權(quán)利要求8所述的處理設(shè)備,其特征在于,所述處理器在根據(jù)所述圖像特征向量與文本的文本特征向量之間的相關(guān)度,確定所述目標(biāo)圖像對(duì)應(yīng)的文本之前,還用于根據(jù)所述圖像特征向量與所述文本特征向量之間的歐式距離,確定所述目標(biāo)圖像與文本之間的相關(guān)度。
10.根據(jù)權(quán)利要求8所述的處理設(shè)備,其特征在于,所述處理器根據(jù)所述圖像特征向量與文本的文本特征向量之間的相關(guān)度,確定所述目標(biāo)圖像對(duì)應(yīng)的文本,包括:
將文本特征向量與所述目標(biāo)圖像的圖像特征向量之間的相關(guān)度大于預(yù)設(shè)閾值的一個(gè)或多個(gè)文本作為所述目標(biāo)圖像對(duì)應(yīng)的文本;
或者,將文本特征向量與所述目標(biāo)圖像的圖像特征向量之間的相關(guān)度位于前預(yù)設(shè)數(shù)量的文本作為所述目標(biāo)圖像的文本。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團(tuán)控股有限公司,未經(jīng)阿里巴巴集團(tuán)控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710936315.0/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種文本數(shù)據(jù)分析方法、裝置、服務(wù)器和存儲(chǔ)介質(zhì)
- 問答文本的語義匹配方法、裝置、介質(zhì)及電子設(shè)備
- 一種文本分類方法及裝置
- 圖文檢測方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 文本分類方法及裝置
- 一種文本輸出方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種實(shí)體提取方法、裝置及可讀存儲(chǔ)介質(zhì)
- 文本排序方法及裝置
- 一種基于特征表示學(xué)習(xí)的跨領(lǐng)域情感分類方法及系統(tǒng)
- 文本分類方法、裝置、電子設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)





